您的位置: 专家智库 > >

徐谷子

作品数:2 被引量:4H指数:1
供职机构:北京大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:文化科学更多>>

文献类型

  • 1篇期刊文章
  • 1篇专利

领域

  • 1篇文化科学

主题

  • 2篇查询
  • 2篇查询意图
  • 1篇信息检索
  • 1篇信息检索技术
  • 1篇引擎
  • 1篇日志
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇索引
  • 1篇文本
  • 1篇文档
  • 1篇查询分类
  • 1篇长尾

机构

  • 2篇北京大学
  • 1篇北京师范大学

作者

  • 2篇闫宏飞
  • 2篇何靖
  • 2篇徐谷子
  • 2篇刘晓兵
  • 1篇陈翀
  • 1篇李铄

传媒

  • 1篇情报学报

年份

  • 2篇2012
2 条 记 录,以下是 1-2
排序方式:
一种搜索引擎的查询意图发现的新方法被引量:4
2012年
查询背后的信息需求被定义为查询意图,搜索引擎可以根据不同的查询意图,提供多样性的服务,优化检索效果。查询意图的识别多被看成是一种分类问题,现有的大多数方法都基于查询串文本本身的特征和查询的用户点击数据特征。这两种方法存在如下的困难:对于查询串的文本特征,查询比较短,特征比较稀疏,要进行比较准确的理解会比较困难;对于用户点击特征,由于用户提交查询的长尾性分布,大多数查询的提交次数都是较少的,对于这些查询,要判别它们的意图是比较困难的。为了克服长尾查询上查询意图判断的不可靠问题。本文提出利用查询结果的相关性分数的分布作为特征来判断查询意图的方法。这种方法依赖查询结果的特征,比查询串本身的特征更加丰富;同时不依赖于用户的点击数据,因此可以克服长尾查询上的困难。结果表明,使用结果分数分布,可以提高意图判别的准确程度。
陈翀刘晓兵徐谷子何靖闫宏飞
关键词:查询意图查询分类
基于相关性分数分布对查询意图进行分类的方法
本发明涉及网络和信息检索技术领域,公开了一种基于相关性分数分布对查询意图进行分类的方法,包括以下步骤:S1、获取查询的检索结果和网页;S2、根据所述检索结果和网页构建检索结果集;S3、度量所述检索结果集中文档的相关性分数...
闫宏飞刘晓兵徐谷子何靖李铄
文献传递
共1页<1>
聚类工具0