您的位置: 专家智库 > >

王国勇

作品数:1 被引量:17H指数:1
供职机构:天津大学管理与经济学部系统工程研究所更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇隐含语义分析
  • 1篇语义分析
  • 1篇奇异值
  • 1篇奇异值分解
  • 1篇中文
  • 1篇中文文本
  • 1篇中文文本聚类
  • 1篇文本聚类
  • 1篇向量
  • 1篇向量空间
  • 1篇向量空间模型
  • 1篇聚类

机构

  • 1篇天津大学

作者

  • 1篇徐建锁
  • 1篇王国勇

传媒

  • 1篇计算机工程

年份

  • 1篇2004
1 条 记 录,以下是 1-1
排序方式:
TCBLSA:一种中文文本聚类新方法被引量:17
2004年
根据隐含语义分析(LSA)理论,提出了一种文本聚类的新方法。该方法应用LSA理论来构建文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的“噪声”因素,从而更加突出了词和文本之间的语义关系。通过奇异值分解(SVD),有效地降低了向量空间的维数,从而提高了文本聚类的精度和速度。
王国勇徐建锁
关键词:文本聚类隐含语义分析奇异值分解向量空间模型
共1页<1>
聚类工具0