您的位置: 专家智库 > >

国家教育部博士点基金(20060698018)

作品数:5 被引量:6H指数:2
相关作者:乔亚男侯迪齐勇王晓史椸更多>>
相关机构:西安交通大学第四军医大学唐都医院更多>>
发文基金:国家教育部博士点基金国家高技术研究发展计划国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 4篇信息检索
  • 2篇计算机
  • 2篇计算机应用
  • 1篇文本信息
  • 1篇文本信息检索
  • 1篇稳定性
  • 1篇相似度
  • 1篇向量
  • 1篇向量空间
  • 1篇向量空间模型
  • 1篇检索查询
  • 1篇分析方法
  • 1篇高稳定
  • 1篇高稳定性
  • 1篇查询
  • 1篇词汇相似度

机构

  • 5篇西安交通大学
  • 1篇第四军医大学...

作者

  • 5篇齐勇
  • 5篇侯迪
  • 5篇乔亚男
  • 1篇史椸
  • 1篇王晓

传媒

  • 2篇西安交通大学...
  • 2篇中国科技论文...
  • 1篇计算机科学

年份

  • 5篇2009
5 条 记 录,以下是 1-5
排序方式:
具有孤立项过滤的信息检索查询词的分析方法
2009年
针对传统查询词临近性(QTP)分析方法无法有效提高查准率的问题,提出了一种孤立项过滤的信息检索查询词分析方法.该方法根据词汇相似度较高的查询词对之间具有强可替代性这一事实,从查询词及其实例中分解出查询内的孤立项和文档内的孤立项,在分析查询词临近性之前预先进行孤立项过滤,使之不参与QTP统计量的计算,由此减小了过分强调临近性对查准率的影响.实验结果表明,对于词汇相似度差异比较显著的查询,进行孤立项过滤的查询词临近性分析方法的平均检索精确度比传统分析方法提高14%.
乔亚男齐勇侯迪
关键词:信息检索词汇相似度
一种高稳定性词汇共现模型被引量:2
2009年
针对传统词汇共现模型存在的缺乏理论基础和稳定性欠佳等问题,提出了一种基于项场的高稳定性词汇共现模型.借鉴经典物理学中场的概念给出了项场的定义,其中项是语言的基本单位,是概念的抽象描述,而项场则是项在文档中的影响范围.在此基础上,引入量子场论将项与项的相关度类比为项场的叠加,由此给出了项与项之间距离和相关度的函数关系,并用其建立了词汇共现模型.实验结果证明,在小距离的情况下,所提模型中项的相关度大体呈常数,具有一定的窗口内稳定性,而同范畴的项对相关度振幅只有对照模型中最小振幅的26%,表明它具有较好的数据集稳定性.
乔亚男齐勇侯迪
文本信息检索实验方法研究被引量:1
2009年
阐述了信息检索研究领域的现状和进行信息检索研究所需的重要实验方法。在介绍了信息检索系统的架构和常见的信息检索研究方向的基础上,对信息检索研究实验的3要素:数据集、实验平台和创新算法进行了详细说明,并对实验平台Lemur和Lucene的异同点做了重点分析。
乔亚男齐勇侯迪
关键词:计算机应用信息检索
高阶信息检素问题相关研究进展被引量:1
2009年
提出高阶信息检索问题这一概念,将多种信息检索的深层次问题统一在1个框架内,给出了词汇共现、语义查询扩展和统计语言模型3个高阶信息检索问题统一解决模型的技术基础,对高阶信息检索问题相关的研究进展进行了阐述,展望了高阶信息检索的发展趋势。
乔亚男齐勇侯迪
关键词:计算机应用
一种基于权重矩阵的临近词检索问题解决框架被引量:2
2009年
传统的信息检索模型假设查询中的关键词之间是并列关系,但用户的需求往往应该被抽象为一系列的关键词组,组内的关键词间具有更为紧密的语义关系,这就是定义的临近词检索问题。提出了基于权重矩阵的临近词检索问题解决框架,该框架将文档和查询抽象化为文档的权重矩阵表示和查询权重矩阵,通过计算两个矩阵间的相似度来实现临近词检索。实验结果证明,针对临近词检索问题,传统的信息检索模型只是一种简化问题的解决方案,权重矩阵框架从理论上和形式上更加契合临近词检索问题,查准率得到了显著的提高。
乔亚男齐勇史椸侯迪王晓
关键词:信息检索向量空间模型
共1页<1>
聚类工具0