您的位置: 专家智库 > >

重庆市自然科学基金(CSTC2012JJA1525)

作品数:1 被引量:4H指数:1
相关作者:李波石慧霞王毅更多>>
相关机构:重庆理工大学更多>>
发文基金:重庆市自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇知网
  • 1篇同义
  • 1篇同义词
  • 1篇文本
  • 1篇文本分类
  • 1篇相关系数

机构

  • 1篇重庆理工大学

作者

  • 1篇王毅
  • 1篇石慧霞
  • 1篇李波

传媒

  • 1篇重庆理工大学...

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
一种基于同义词发现的文本扩充算法被引量:4
2014年
文本分类算法在进行分类时存在待分类文本中关键词稀疏、难以充分表征文本特性的问题,导致文本分类的准确率不高。提出一种基于同义词发现的文本扩充算法,利用知网中义原间的层次架构,获取待分类文本中关键词的位置信息,并发现关键词路径中位于不同层次的同义词,利用知网义原之间层次性和密度差异为关键词和不同层次的同义词之间赋予相应的相关系数。将提出的文本扩充算法运用于文本分类,以20Newsgroups和Reuters21578 Top10为测试数据集进行实验。实验结果表明:改进算法的文本分类准确率和F1值有了较大提高。
李波石慧霞王毅
关键词:知网相关系数文本分类
共1页<1>
聚类工具0