国防科技大学优秀研究生创新基金(S100502)
- 作品数:5 被引量:45H指数:3
- 相关作者:葛斌肖卫东谭文堂李芳芳周城更多>>
- 相关机构:国防科技大学更多>>
- 发文基金:国防科技大学优秀研究生创新基金国家自然科学基金湖南省自然科学基金更多>>
- 相关领域:自动化与计算机技术自然科学总论理学更多>>
- 网络节点重要度的快速评估方法被引量:9
- 2013年
- 对网络节点进行重要性评估,快速发掘重要性节点已经成为数据挖掘、复杂网络中的一个基本问题,现有的节点重要度评估方法对于大型网络而言,计算速度较慢.基于电阻网络提出一种快速实用的节点重要度评估方法,该方法利用节点对网络电能消耗的影响来评估节点的重要度,如果由于一个节点的存在而导致网络平均电能消耗减少,则该节点就越重要,更之则该节点重要度就低.该方法的时间复杂度为O(n^3),在分布式扩展的情况下可达到O(n),实验分析证明了该方法的有效性,而且运算速度快,能处理大规模网络.
- 肖卫东谭文堂葛斌李芳芳
- 关键词:网络节点重要度电阻网络电能消耗
- 基于相关性和冗余度的联合特征选择方法被引量:16
- 2012年
- 比较研究了与类别信息无关的文档频率和与类别信息有关的信息增益、互信息和χ2统计特征选择方法,在此基础上分析了以往直接组合这两类特征选择方法的弊端,并提出基于相关性和冗余度的联合特征选择算法。该算法将文档频率方法分别与信息增益、互信息和χ2统计方法联合进行特征选择,旨在删除冗余特征,并保留有利于分类的特征,从而提高文本情感分类效果。实验结果表明,该联合特征选择方法具有较好的性能,并且能够有效降低特征维数。
- 周城葛斌唐九阳肖卫东
- 关键词:文本情感分类
- 垃圾评论自动过滤方法被引量:16
- 2012年
- 针对互联网上存在的大量垃圾评论,提出一种基于电阻网络的垃圾评论检测方法,该方法用电阻距离来度量评论之间的上下文语义相似性,把整个评论数据表示成一个电阻网络,把垃圾评论当作该网络上的语义离群点来处理,根据网络节点对电阻网络平均电能消耗的影响,建立电离群因子来度量数据的离群程度,以此来识别垃圾评论。实验证明了该方法的有效性,在多个数据集上取得了较好的效果。
- 谭文堂朱洪葛斌李芳芳肖卫东
- 一种面向涌现的比较性话题模型被引量:2
- 2013年
- 提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导。在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势。
- 谭文堂王桢文殷风景葛斌肖卫东
- 一种基于消息中间件的网页实时处理技术被引量:2
- 2011年
- 针对传统网页采集分析系统在实时性上的不足,提出了一种基于消息中间件的网页实时处理技术。该技术利用消息中间件在消息队列驱动流程中引入并行调度策略,既继承了传统网页处理系统的可靠性,又实现信息抽取、话题聚类和网页分类等模块的分布式并行处理,增强了系统的实时处理能力。实验证明该文提出的技术在舆情实时采集、处理中较传统方法实时性高。
- 周城葛斌蒋林承
- 关键词:消息中间件实时性并行调度舆情