童薇
- 作品数:2 被引量:21H指数:1
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:中国人民大学科学研究基金国家自然科学基金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- EDM:高效的微博事件检测算法被引量:21
- 2012年
- 微博数据具有实时动态特性,人们通过分析微博数据可以检测现实生活中的事件。同时,微博数据的海量、短文本和丰富的社交关系等特性也为事件检测带来了新的挑战。综合考虑了微博数据的文本特征(转帖、评论、内嵌链接、用户标签hashtag、命名实体等)、语义特征、时序特性和社交关系特性,提出了一种有效的基于微博数据的事件检测算法(event detection in microblogs,EDM)。还提出了一种通过提取事件关键要素,即关键词、命名实体、发帖时间和用户情感倾向性,构成事件摘要的方法。与基于LDA(latent Dirichlet allocation)模型的事件检测算法进行实验对比,结果表明,EDM算法能够取得更好的事件检测效果,并且能够提供更直观可读的事件摘要。
- 童薇陈威孟小峰
- 关键词:特征选取
- EDM:高效的微博事件检测算法
- 微博数据具有实时动态特性,人们通过分析微博数据可以检测现实生活中的事件。同时,微博数据的海量、短文本和丰富的社交关系等特性也为事件检测带来了新的挑战。综合考虑了微博数据的文本特征(转帖、评论、内嵌链接、用户标签hasht...
- TONG Wei童薇CHEN Wei陈威MENG Xiaofeng孟小峰
- 关键词:特征选取文本特征