江西省教育厅科学技术研究项目(20072129)
- 作品数:3 被引量:17H指数:2
- 相关作者:付剑波王明文罗远胜陆旭张华伟更多>>
- 相关机构:江西财经大学江西师范大学更多>>
- 发文基金:江西省科技攻关计划国家自然科学基金江西省教育厅科学技术研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种新的基于中间语义的跨语言信息检索模型被引量:10
- 2009年
- 目前的跨语言信息检索能够使用的方法有四种:查询词翻译的方法、文档翻译的方法、中间语言翻译方法和非翻译的方法。该文对这四种方法进行了简要介绍,提出它们的优缺点,并且提出了一种新的非翻译的方法——基于中间语义的方法。我们对提出来的方法进行了TREC跨语言语料库的试验,并且与单语言的信息检索模型进行了比较。试验证明我们的方法具有很好的性能和健壮性。
- 黄国斌王明文叶浩
- 关键词:跨语言信息检索偏最小二乘TREC
- 基于团模型的文档重排算法研究被引量:2
- 2009年
- 为了满足用户对信息检索结果准确不断提高的需求,尽可能应用那些与查询及检索结果有关的信息进行查询结果优化是一种有效的手段。查询扩展和结果重排就是利用附加信息进行检索结果优化的方法。该文提出了基于文档团的文档重排模型(DCRM模型),此模型通过对文档集的学习,构造文档与文档关系的Markov网络,提取出文档Markov网络中的"文档团",应用文档团信息进行文档重排。在adi、cacm、med、cisi和cran五个数据集上的实验结果表明,本文提出的基于文档团的文档重排模型较BM25模型性能得到有效提高。
- 付剑波王明文罗远胜张华伟
- 关键词:计算机应用中文信息处理MARKOV网络
- 一种新的基于中间语义的跨语言信息检索模型
- 目前的跨语言信息检索能够使用的方法有四种:查询词翻译的方法、文档翻译的方法、中间语言翻译方法和非翻译的方法。本文对这四种方法进行了简要介绍,提出它们的优缺点,并且提出了一种新的非翻译的方法——基于中间语义的方法。我们对提...
- 黄国斌王明文叶浩
- 关键词:跨语言信息检索偏最小二乘TREC
- 文献传递
- 基于协同聚类的两阶段文本聚类方法被引量:5
- 2009年
- 为了将语义信息用于文本聚类和有效地进行特征选择,文中提出一种基于协同聚类的两阶段文本聚类方法.该方法分别对文档和特征进行聚类从而得到特征与主题之间的语义关联关系.然后利用此关系来相互调整彼此的聚类结果.实验结果表明,利用特征与主题之间的语义关联关系能有效提高聚类效果.
- 王明文付剑波罗远胜陆旭
- 关键词:文本聚类协同聚类
- 基于协同聚类的两阶段文本聚类方法研究
- 作为一种自然语言处理应用,文本聚类具有高维和语义相关的特点,属于无监督的学习方法。但由于缺乏类别信息,成功应用于文本分类的有监督的特征选择方法很难直接应用于文本聚类。为了将语义信息用于文本聚类和有效地进行特征选择,本文提...
- 王明文付剑波罗远胜陆旭
- 关键词:文本聚类协同聚类
- 文献传递