骆雄武
- 作品数:8 被引量:10H指数:1
- 供职机构:北京大学更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于后缀树的Web检索结果聚类标签生成方法被引量:10
- 2009年
- 对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之前就产生好的标签,在生成了标签的基础上,再进行检索结果聚类。对于搜索引擎返回的结果,我们先统一建立一棵后缀树,然后计算后缀树中各个短语的得分,选取得分最高的若干短语作为候选标签。得到标签后,将搜索引擎返回的各个结果项分配到它所包含的标签对应的分类中,形成最后的聚类。实验表明,我们的方法是比较有效的。
- 骆雄武万小军杨建武吴於茜
- 关键词:计算机应用中文信息处理检索结果聚类后缀树
- 检索结果聚类方法及装置
- 本发明公开了一种检索结果聚类方法及装置,用以解决按照现有技术提供的检索结果聚类方法使得用户难以按照聚类标签找到符合自己需求的检索结果的问题。其中,本发明公开的该方法包括步骤:从检索结果中选取规定数目的短语;针对选取到的每...
- 骆雄武万小军杨建武吴於茜
- 检索结果聚类方法及装置
- 本发明公开了一种检索结果聚类方法及装置,用以解决按照现有技术提供的检索结果聚类方法使得用户难以按照聚类标签找到符合自己需求的检索结果的问题。其中,本发明公开的该方法包括步骤:从检索结果中选取规定数目的短语;针对选取到的每...
- 骆雄武万小军杨建武吴於茜
- 文献传递
- 基于后缀树的Web检索结果聚类标签生成方法
- 对检索结果进行聚类能够方便用户从搜索结果中快速的找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。本文提出了一种新的思路,注重于如何在聚类之...
- 骆雄武万小军杨建武吴於茜
- 关键词:检索结果聚类后缀树
- 文献传递
- 互联网热点话题检测与深度分析技术
- 针对互联网持续舆情信息流热点话题检测的实际应用,本文在综合考虑舆论话题的特征和人们的认知规律基础上,提出了舆论话题评价策略,基于该评价策略对话题进行排序、合并、调整和淘汰,实现了一个实用的舆论热点话题检测方法。在此基础上...
- 骆雄武万小军杨建武
- 关键词:互联网信息检索
- 基于后缀树和LDA的检索结果聚类方法及实现
- 在信息全球化的今天,为了主动、快速、高效地获取自己需要的信息,人们对于搜索引擎的使用越来越频繁。当前的通用搜索引擎,对于任意查询,其检索结果都是以线性列表的形式组织展现,导致用户很有可能需要浏览多个页面之后才能找到自己需...
- 骆雄武
- 关键词:检索结果聚类后缀树搜索引擎
- 检索结果聚类方法及装置
- 本发明公开了一种检索结果聚类方法及装置,用以解决按照现有技术提供的检索结果聚类方法使得用户难以按照聚类标签找到符合自己需求的检索结果的问题。其中,本发明公开的该方法包括步骤:从检索结果中选取规定数目的短语;针对选取到的每...
- 骆雄武万小军杨建武吴於茜
- 文献传递
- 检索结果聚类方法及装置
- 本发明公开了一种检索结果聚类方法及装置,用以解决按照现有技术提供的检索结果聚类方法使得用户难以按照聚类标签找到符合自己需求的检索结果的问题。其中,本发明公开的该方法包括步骤:从检索结果中选取规定数目的短语;针对选取到的每...
- 骆雄武万小军杨建武吴於茜
- 文献传递