您的位置: 专家智库 > >

区雄发

作品数:1 被引量:1H指数:1
供职机构:广东外语外贸大学思科信息学院更多>>
发文基金:广东省高等学校自然科学研究重点项目国家自然科学基金广东省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇文本聚类
  • 1篇聚类
  • 1篇加权
  • 1篇加权函数

机构

  • 1篇广东外语外贸...

作者

  • 1篇蒋盛益
  • 1篇庞观松
  • 1篇张黎莎
  • 1篇赖旭明
  • 1篇区雄发

传媒

  • 1篇情报学报

年份

  • 1篇2011
1 条 记 录,以下是 1-1
排序方式:
Web搜索结果多层聚类方法研究被引量:1
2011年
为了便于用户浏览搜索引擎返回结果,本文提出了一种基于TFIDF新的文本相似度计算方法,并提出使用具有近似线性时间复杂度的增量聚类算法对文本进行多层聚类的策略。同时,提出了一种从多文本中提取关键词的策略:提取簇中的名词或名词短语作为候选关键词,综合考虑每个候选关键词的词频、出现位置、长度和文本长度设置加权函数来计算其权重,不需要人工干预以及语料库的协助,自动提取权重最大的候选关键词作为类别关键词。在收集的百度、ODP语料以及公开测试的实验结果表明本文提出方法的有效性。
庞观松蒋盛益张黎莎区雄发赖旭明
关键词:文本聚类加权函数
共1页<1>
聚类工具0