您的位置: 专家智库 > >

姚健民

作品数:1 被引量:4H指数:1
供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
发文基金:哈尔滨市青年科学研究基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇数据稀疏
  • 1篇聚类
  • 1篇均值聚类
  • 1篇K-均值
  • 1篇K-均值聚类

机构

  • 1篇哈尔滨工业大...

作者

  • 1篇于浩
  • 1篇梁颖红
  • 1篇徐冰
  • 1篇赵铁军
  • 1篇姚健民

传媒

  • 1篇哈尔滨工业大...

年份

  • 1篇2007
1 条 记 录,以下是 1-1
排序方式:
基于改进K-均值聚类的汉语语块识别被引量:4
2007年
为了既避免数据稀疏又充分考虑相邻词性的关系和每种短语的内部组成规律,提出了改进K-均值聚类方法.此方法把每个短语看成是以中心词为核心的聚簇,充分考虑每种短语的内部组成规律;依据语料库中的数据来确定每个类的初始中心,使有指导的统计方法和无指导的聚类方法有机结合,既提高了聚类的准确率,又避免了因汉语语块库规模较小而导致的数据稀疏现象.应用改进K-均值聚类方法对7种汉语语块进行识别,F值达到了92.94%,因此,该方法对汉语语块识别是有效的.
梁颖红赵铁军于浩姚健民徐冰
关键词:K-均值聚类数据稀疏
共1页<1>
聚类工具0