肖昕
- 作品数:3 被引量:8H指数:2
- 供职机构:沈阳航空航天大学更多>>
- 发文基金:辽宁省教育厅基金资助项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于论坛信息的网络组织发现技术研究
- 网络组织是由网络上的系列活性结点构成,因相同的利益目标聚集在一起,具有群体行为特征。网络水军是网络组织的主要形式,主要从事话题炒作等干扰舆情正常传播的行为,因此有必要对其特征和行为开展深入研究。目前网络组织的发现技术主要...
- 肖昕
- 文献传递
- 基于论坛信息的水军组织行为分析被引量:4
- 2012年
- 网络水军是网络组织的主要形式,主要从事话题炒作等干扰舆情正常传播的行为,因此有必要对其特征和行为开展深入探讨。本文以特定网络论坛数据为分析对象,抽取论坛上特定板块的帖文、回复和账户信息,分析了信息发布的时间分布特点;人工分析了水军帖、水军账户在该论坛的总体分布情况;并进一步利用由账户及其间关系构成的复杂网络,分析了论坛上社区和网络组织的统计特征和典型结构;多方面确认了水军不但在论坛上大量存在,而且具有典型的组织结构特征。
- 范纯龙肖昕余玲徐蕾
- 关键词:网络水军
- 基于功能语义单元的博客评论抽取技术被引量:3
- 2011年
- 博客作为一类重要的网络信息资源,其评论信息抽取是舆情分析等研究工作的基础。总结了当前主流的博客评论抽取算法,介绍了页面结构在信息抽取中的应用,并结合人理解网页时充分利用"首页"等指示性短语的特点,提出利用具有明确语义和功能指示作用的功能语义单元来抽取评论信息的技术;详细介绍了抽取过程中涉及的页面结构线性化、功能语义单元识别、正文识别和评论抽取算法等内容。最后,通过实验证明,该技术在博客的正文和评论信息抽取上能取得良好效果。
- 范纯龙夏佳肖昕吕红伟徐蕾
- 关键词:信息抽取