黄宇鹏
- 作品数:2 被引量:9H指数:2
- 供职机构:广东工业大学计算机学院更多>>
- 发文基金:广东省科技计划工业攻关项目国家自然科学基金广东省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 结合用户兴趣的微博信息传播模式挖掘被引量:5
- 2016年
- 由于信息传播模型是社区挖掘、社区影响力研究的基础,文中提出结合用户兴趣的信息传播模型,设计基于频繁子树的信息传播微观模式挖掘方法.首先,基于微博社交网络图表示及用户多标签建模,将微观信息传播模式转换为频繁子树挖掘问题.然后,针对微博社交网络图单节点多标签特性,设计多标签节点树的频繁子树挖掘算法(MLTree Miner).最后,结合主题提取方法,使用MLTree Miner挖掘信息传播模式.在人工数据集上的实验表明,MLtree Miner能高效地对多标签节点树进行频繁子树挖掘.针对新浪微博真实数据的实验也验证方法的有效性.
- 郝志峰黄灿锦蔡瑞初温雯黄宇鹏陈炳丰
- 关键词:社交网络用户兴趣频繁子树挖掘
- 一种分布式的舆情分析系统架构被引量:4
- 2013年
- 随着互联网数据的快速增长,针对如何对互联网数据进行有效的收集和分析,提出一种基于分布式平台的系统架构。该架构包括爬虫模块、Web模块以及分布式平台三大模块,其中爬虫模块负责数据的收集,Web模块负责简单任务的处理以及分析结果的可视化展示,分布式平台提供数据的存储以及复杂任务的计算功能,3个模块的结合为网络上海量数据的爬取、存储与分析提供了一个很好的解决方案。最后,针对社交网站新浪微博的应用案例验证了该分布式舆情分析系统架构的可用性。
- 黄宇鹏袁畅郝志峰蔡瑞初肖晓军卢宇
- 关键词:分布式系统架构舆情分析爬虫可视化