您的位置: 专家智库 > >

杨正良

作品数:2 被引量:3H指数:1
供职机构:华中师范大学计算机学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 2篇文本分类
  • 1篇特征提取
  • 1篇主成分
  • 1篇主成分分析
  • 1篇可视化
  • 1篇复杂度

机构

  • 2篇华中师范大学

作者

  • 2篇杨正良
  • 1篇马长林

传媒

  • 1篇计算机工程与...

年份

  • 1篇2017
  • 1篇2016
2 条 记 录,以下是 1-2
排序方式:
文本分类中CTM模型的优化和可视化应用研究被引量:3
2017年
如何从海量文本中自动提取相关信息已成为巨大的技术挑战,文本分类作为解决该问题的重要方法已引起广大关注,而其中文本表示是影响分类效果的关键因素。为此采用相关主题模型进行文本表示,以保证信息完整同时表现主题相关性;基于该模型,对主题数目和特征提取实施了优化处理,综合复杂度和对数似然函数来确定最优主题数目,引入基于互信息的主成分分析算法进行最优特征提取,降低数据维度和特征冗余,使用R语言进行可视化实验分析。
马长林杨正良谢罗迪
关键词:文本分类特征提取
优化特征选择的CTM模型在文本分类中的应用研究
随着互联网的快速发展、海量信息的出现,人们已经从信息资源匮乏的年代过渡到信息资源丰富的大数据时代。如何快速、有效地从海量信息中提取所需的信息是当今信息科学和技术领域面临的一大挑战,而文本分类就是解决这一问题的途径之一。其...
杨正良
关键词:文本分类复杂度主成分分析
文献传递
共1页<1>
聚类工具0