您的位置: 专家智库 > >

刘晓兵

作品数:4 被引量:7H指数:2
供职机构:北京大学更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
相关领域:文化科学更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文
  • 1篇专利

领域

  • 3篇文化科学

主题

  • 3篇查询
  • 2篇引擎
  • 2篇搜索
  • 2篇搜索引擎
  • 2篇索引
  • 2篇查询分类
  • 2篇查询意图
  • 1篇大众
  • 1篇大众分类
  • 1篇信息检索
  • 1篇信息检索技术
  • 1篇意图
  • 1篇日志
  • 1篇网络
  • 1篇网络资源
  • 1篇文本
  • 1篇文档
  • 1篇目录树
  • 1篇长尾

机构

  • 4篇北京大学
  • 2篇北京师范大学

作者

  • 4篇刘晓兵
  • 2篇闫宏飞
  • 2篇何靖
  • 2篇陈翀
  • 2篇徐谷子
  • 1篇陆炀
  • 1篇罗鹏程
  • 1篇李铄

传媒

  • 1篇中国图书馆学...
  • 1篇情报学报

年份

  • 4篇2012
4 条 记 录,以下是 1-4
排序方式:
一种搜索引擎的查询意图发现的新方法被引量:4
2012年
查询背后的信息需求被定义为查询意图,搜索引擎可以根据不同的查询意图,提供多样性的服务,优化检索效果。查询意图的识别多被看成是一种分类问题,现有的大多数方法都基于查询串文本本身的特征和查询的用户点击数据特征。这两种方法存在如下的困难:对于查询串的文本特征,查询比较短,特征比较稀疏,要进行比较准确的理解会比较困难;对于用户点击特征,由于用户提交查询的长尾性分布,大多数查询的提交次数都是较少的,对于这些查询,要判别它们的意图是比较困难的。为了克服长尾查询上查询意图判断的不可靠问题。本文提出利用查询结果的相关性分数的分布作为特征来判断查询意图的方法。这种方法依赖查询结果的特征,比查询串本身的特征更加丰富;同时不依赖于用户的点击数据,因此可以克服长尾查询上的困难。结果表明,使用结果分数分布,可以提高意图判别的准确程度。
陈翀刘晓兵徐谷子何靖闫宏飞
关键词:查询意图查询分类
网络资源层次组织规律定量研究被引量:3
2012年
本文以互联网FTP目录树为对象,从大众构造的层次式结构中揭示管理网络资源时的组织规律。通过考察44,972个软件资源及其在目录树中的位置,得到如下认识:①对于用户查找、浏览资源来说,资源存放在深度为2或3层较适合。②当要管理的资源数量在200以内时,人们可容忍平均1个目录中包含10个左右的软件资源;当资源数量更大时,人们可容忍平均1个目录中包含15个左右的软件资源。③在使用层次式组织结构时,人们会对结构的深度有一个习惯上限,目录结构平均深度一般不多于6层。④人们考虑组织结构时,会在"分类体系复杂度"和"分类精细度"之间权衡,在资源量增多时,尽量保证扁形结构。本文揭示了采用层次方式组织资源时的一些共性,有助于设计更贴近大众习惯的网络资源组织与导航系统,并对标签聚类等从扁平型信息组织方式中提取类目层次的研究工作提供依据。
陈翀罗鹏程刘晓兵陆炀
关键词:网络资源目录树大众分类
基于相关性分数分布对查询意图进行分类的方法
本发明涉及网络和信息检索技术领域,公开了一种基于相关性分数分布对查询意图进行分类的方法,包括以下步骤:S1、获取查询的检索结果和网页;S2、根据所述检索结果和网页构建检索结果集;S3、度量所述检索结果集中文档的相关性分数...
闫宏飞刘晓兵徐谷子何靖李铄
文献传递
搜索引擎查询分类方法的研究与实现
查询意图被定义为查询背后的信息需求,正确分类用户的查询意图,能够帮助商业化搜索引擎优化检索结果,提供更加准确的检索服务。由于用户的查询  关键词一般较短(平均长度2-3),通过查询词本身的特征对查询进行分类比较困难。本文...
刘晓兵
关键词:查询分类
共1页<1>
聚类工具0