您的位置: 专家智库 > >

葛运东

作品数:8 被引量:11H指数:2
供职机构:苏州大学计算机科学与技术学院江苏省计算机信息处理技术重点实验室更多>>
发文基金:国家自然科学基金江苏省现代企业信息化应用支撑软件工程技术研发中心开放基金更多>>
相关领域:自动化与计算机技术文化科学语言文字更多>>

文献类型

  • 4篇期刊文章
  • 2篇学位论文
  • 2篇会议论文

领域

  • 6篇自动化与计算...
  • 2篇文化科学
  • 1篇语言文字

主题

  • 6篇信息检索
  • 6篇跨语言信息检...
  • 5篇查询
  • 5篇查询翻译
  • 4篇网络
  • 3篇登录
  • 3篇语料库
  • 3篇未登录词
  • 2篇译文
  • 2篇引擎
  • 2篇语料
  • 2篇搜索
  • 2篇搜索引擎
  • 2篇索引
  • 2篇网络挖掘
  • 2篇抽取
  • 1篇英文缩略语
  • 1篇语料库构建
  • 1篇双语语料
  • 1篇双语语料库

机构

  • 8篇苏州大学
  • 2篇江苏省现代企...
  • 1篇苏州市科学技...

作者

  • 8篇葛运东
  • 6篇姚建民
  • 4篇孙常龙
  • 2篇洪宇
  • 2篇梁颖红
  • 2篇房璐
  • 1篇朱巧明
  • 1篇孙萌
  • 1篇颜振祥

传媒

  • 1篇计算机研究与...
  • 1篇广西师范大学...
  • 1篇微电子学与计...
  • 1篇江南大学学报...
  • 1篇第十届全国计...

年份

  • 1篇2011
  • 4篇2010
  • 3篇2009
8 条 记 录,以下是 1-8
排序方式:
基于搜索引擎的专有名称译文挖掘研究
查询翻译是影响跨语言信息检索的关键因素之一,而查询中有很大比重是专有名称,因此专有名称译文的挖掘对改进查询系统性能具有重要意义。本文首先利用主题词译文查询扩展方法从搜索引擎获取有效双语摘要资源;其次,利用频度变化信息和邻...
葛运东孙常龙房璐姚建民
关键词:跨语言信息检索查询翻译查询扩展
文献传递
基于维基百科的未登录词译文挖掘被引量:2
2011年
未登录词(out of vocabulary,OOV)的查询翻译是影响跨语言信息检索(cross-language information retrieval,CLIR)性能的关键因素之一.它根据维基百科(Wikipedia)的数据结构和语言特性,将译文环境划分为目标存在环境和目标缺失环境.针对目标缺失环境下的译文挖掘难点,它采用频度变化信息和邻接信息实现候选单元抽取,并建立基于频度-距离模型、表层匹配模板和摘要得分模型的混合译文挖掘策略.实验将基于搜索引擎的未登录词挖掘技术作为baseline,并采用TOP1进行评测.实验验证基于维基百科的混合译文挖掘方法可达到0.6822的译文正确率,相对baseline取得6.98%的改进.
孙常龙洪宇葛运东姚建民朱巧明
关键词:未登录词维基百科跨语言信息检索
跨预言信息检索查询翻译技术研究
跨语言信息检索(CLIR)是用户采用一种语言的查询检索另一种语言的文档集合的过程。查询翻译是CLIR系统中采用最广泛的方法。查询翻译普遍采用基于词典的方法,而查询中的未登录词(OOV)使CLIR的性能显著降低。因此如何正...
葛运东
关键词:跨语言信息检索网络资源双语语料库
基于网络的英文缩略语全称挖掘
本文提出了一种新颖的缩略语全称挖掘方法,分别利用Google和Wikipedia挖掘英文缩略语全称,然后比较两者的正确率和召回率。具体而言,首先利用基于Google的方法挖掘英文缩略语的全称,然后与利用基于Wikiped...
杨华孙常龙赵明明葛运东姚建民
关键词:网络挖掘WIKIPEDIA句法规则
文献传递
跨语言信息检索查询翻译技术研究
跨语言信息检索(CLIR)是用户采用一种语言的查询检索另一种语言的文档集合的过程。查询翻译是CLIR系统中采用最广泛的方法。查询翻译普遍采用基于词典的方法,而查询中的未登录词(OOV)使CLIR的性能显著降低。因此如何正...
葛运东
关键词:跨语言信息检索查询翻译未登录词搜索引擎
文献传递
基于网络的跨语言信息检索中OOV译文挖掘研究被引量:2
2009年
查询翻译是影响跨语言信息检索(CLIR)性能的关键因素之一.查询中未登录词(OOV)译文的挖掘对改进CLIR性能具有重要意义.利用主题词译文查询扩展方法从搜索引擎自动获取有效双语摘要资源;采用频度变化信息和邻接信息从双语摘要资源中抽取多词候选单元,并与常见的基于统计的多词单元抽取方法进行了比较.实验中译文挖掘方法取得了TOP 1包含率62.02%,TOP 10包含率95.35%的效果.
葛运东梁颖红孙常龙房璐姚建民
关键词:跨语言信息检索查询翻译
基于平行语料库和网络的未登录词译文挖掘
2010年
分别通过搜索引擎和本地的双语语料库挖掘OOV译文。首先,提出一种利用词汇重叠特征、词对齐特征和位置特征建立最大熵分类器的方法,借以自动从网页信息中抽取和构建双语平行语料库。其次,提出一种结合互信息的频率变化方法生成多词单元,并采用频度-距离模型和音译模型进行正确译文的选择。对这两种挖掘方法的性能进行对比,实验表明基于网络的Top10的包含率达到94.6%,而基于平行语料库的Top10的包含率为37.5%。
孙萌梁颖红葛运东颜振祥姚建民
关键词:网络挖掘
可比较语料库构建及在跨语言信息检索中的应用被引量:5
2010年
本文主要研究基于网络的可比较语料库的构建以及其在跨语言信息检索(CLIR)中的应用。首先从新闻网站获取新闻文本,用Lucene进行对齐,构建可比较语料库;其次,利用上下文信息从对齐的文本中抽取翻译知识;最后,用获得的翻译知识在TDT4语料上进行CLIR性能实验。实验表明,所抽取的翻译知识可以提高CLIR的性能,取得了0.272 8的MAP值,相对于基于本地词典的方法提高了35.44个百分点。
房璐葛运东洪宇姚建民
关键词:跨语言信息检索查询翻译
共1页<1>
聚类工具0