您的位置: 专家智库 > >

何中军

作品数:13 被引量:19H指数:3
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 4篇科技成果
  • 3篇期刊文章
  • 3篇专利
  • 2篇会议论文
  • 1篇学位论文

领域

  • 5篇自动化与计算...
  • 5篇语言文字

主题

  • 13篇翻译
  • 12篇机器翻译
  • 9篇统计机器
  • 6篇统计机器翻译
  • 4篇机器翻译系统
  • 4篇翻译模型
  • 4篇翻译系统
  • 2篇语料库
  • 2篇双语语料
  • 2篇双语语料库
  • 2篇人工智能
  • 2篇子句
  • 2篇句型
  • 2篇基于WEB
  • 2篇固定句型
  • 2篇翻译方法
  • 2篇翻译技术
  • 1篇短语
  • 1篇对齐
  • 1篇语言

机构

  • 13篇中国科学院
  • 1篇厦门大学
  • 1篇中国科学院研...
  • 1篇中国科学院自...

作者

  • 13篇何中军
  • 10篇刘群
  • 6篇吕雅娟
  • 6篇林守勋
  • 5篇刘洋
  • 4篇黄瑾
  • 3篇骆卫华
  • 2篇侯宏旭
  • 2篇叶莎妮
  • 2篇宗成庆
  • 2篇熊德意
  • 2篇任志祥
  • 2篇王建华
  • 2篇付雷
  • 1篇钱跃良
  • 1篇杜金华
  • 1篇陈振标
  • 1篇赵红梅
  • 1篇张华平
  • 1篇史晓东

传媒

  • 2篇中文信息学报
  • 1篇高技术通讯
  • 1篇第三届学术计...
  • 1篇第三届学生计...

年份

  • 1篇2015
  • 2篇2010
  • 3篇2009
  • 3篇2008
  • 1篇2007
  • 3篇2006
13 条 记 录,以下是 1-10
排序方式:
2005统计机器翻译研讨班研究报告被引量:12
2006年
2005年7月13日至15日,中国科学院自动化研究所、计算技术研究所和厦门大学计算机系联合举办了我国首届统计机器翻译研讨班。本文主要介绍本次研讨班参加单位的测试系统和实验结果,并给出相应的分析。测试结果表明,我国的统计机器翻译研究起步虽晚,但已有快速进展,参评系统在短期内得到了较好的翻译质量,与往年参加863评测的基于规则方法的系统相比性能虽还有差距,但差距已经不大。从目前国际统计机器翻译研究的现状和发展趋势来看,随着数据资源规模的不断扩大和计算机性能的迅速提高,统计机器翻译还有很大的发展空间。在未来几年内,在基于短语的主流统计翻译方法中融入句法、语义信息,必将成为机器翻译发展的趋势。
徐波史晓东刘群宗成庆庞薇陈振标杨振东魏玮杜金华陈毅东刘洋熊德意侯宏旭何中军
关键词:人工智能机器翻译统计机器翻译机器翻译评测
基于Web的大规模双语语料库挖掘及翻译知识自动获取
吕雅娟刘洋米海涛叶莎妮王建华骆卫华任志祥何中军黄瑾
本课题得到国家自然科学基金的资助。双语语料库是统计机器翻译及多语自然语言处理研究的重要基础资源。课题研究了基于Web的双语语料库及翻译知识自动获取技术,为大规模、多粒度、多领域的翻译资源的自动获取提供了有效的解决方案。主...
关键词:
关键词:WEB双语语料库机器翻译
基于短语相似度的统计机器翻译模型被引量:3
2009年
针对基于短语的统计机器翻译(SMT)模型中由于采用精确匹配策略导致的短语稀疏问题,提出了一种基于短语相似度的统计机器翻译模型。该模型将基于实例的翻译方法引入到统计机器翻译中。翻译时,对于训练语料库中未出现过的短语,通过计算源语言短语之间的相似度,采用模糊匹配策略从短语表中查找相似的实例短语,并根据实例短语为其构造翻译。与精确匹配策略相比,利用相似度进行模糊匹配增加了对短语表的利用程度,缓解了短语稀疏问题。实验表明,该模型能够明显地提高统计机器翻译的质量,效果超过了当前最好的短语系统'摩西(Moses)'。
何中军刘群林守勋
关键词:相似度
统计机器翻译中短语切分的新方法
基于短语的统计机器翻译是目前主流的一种统计机器翻译方法,但是目前基于短语的翻译系统都没有对短语切分作专门处理,认为一个句子的所有短语切分都是等概率的.本文提出了一种短语切分方法,将句子的短语切分概率化:首先,识别出汉语语...
何中军刘群林守勋
关键词:统计机器翻译翻译模型VITERBI算法
文献传递
基于Web的大规模双语语料库挖掘及翻译知识自动获取技术
吕雅娟刘洋米海涛叶莎妮王建华骆卫华任志祥何中军黄瑾
该课题得到国家自然科学基金的资助。双语语料库是统计机器翻译及多语自然语言处理研究的重要基础资源。课题研究了基于Web的双语语料库及翻译知识自动获取技术,为大规模、多粒度、多领域的翻译资源的自动获取提供了有效的解决方案。主...
关键词:
关键词:双语语料库机器翻译
一种统计机器翻译方法和系统
本发明公开了一种统计机器翻译方法和系统,其中该方法包括下列步骤:1)对源语言句进行短语划分,根据划分的短语从双语短语表中检索双语短语;2)检查划分的短语与双语短语匹配程度,如果完全匹配将双语短语加入候选短语表,执行步骤4...
何中军刘群林守勋
文献传递
统计机器翻译中短语切分的新方法
基于短语的统计机器翻译是目前主流的一种统计机器翻译方法,但是目前基于短语的翻译系统都没有对短语切分作专门处理,认为一个句子的所有短语切分都是等概率的。本文提出了一种短语切分方法,将句子的短语切分概率化:首先,识别出汉语语...
何中军刘群林守勋
关键词:统计机器翻译翻译模型
文献传递
一种融合了句型模板和统计机器翻译技术的翻译方法
本发明公开了一种融合了句型模板和统计机器翻译技术的翻译方法,该方法包括:A、配置句型模板,建立句型模板库;B、利用配置的句型模板对输入的源语言进行匹配,如果匹配成功,则将输入的源语言转换成包含源语言词语与目标语言词语的句...
付雷黄瑾何中军吕雅娟刘群
文献传递
统计机器翻译中短语切分的新方法被引量:4
2007年
基于短语的统计机器翻译是目前主流的一种统计机器翻译方法,但是目前基于短语的翻译系统都没有对短语切分作专门处理,认为一个句子的所有短语切分都是等概率的。本文提出了一种短语切分方法,将句子的短语切分概率化:首先,识别出汉语语料库中所有出现次数大于2次的词语串,将其作为汉语短语;其次,用最短路径方法进行短语切分,并利用Viterbi算法迭代统计短语的出现频率。在2005年863汉英机器翻译评测测试集上的实验结果(BLEU4)是:0.1764(篇章),0.2231(对话)。实验表明,对于长句子(如篇章),短语切分模型的加入有助于提高翻译质量,比原来约提高了0.5个百分点。
何中军刘群林守勋
关键词:人工智能机器翻译统计机器翻译翻译模型
基于大数据的互联网机器翻译核心技术及产业化
王海峰吴华宗成庆刘挺刘洋姜晓红刘群马艳军胡晓光何中军赵铁军孙茂松张家俊吕雅娟叶可江
该项目属于计算机科学技术中人工智能领域的机器翻译学科。机器翻译是利用计算机将一种语言自动翻译为另外一种语言。早在1946年第一台现代计算机诞生之初,美国科学家W.Weaver就提出了机器翻译的设想。机器翻译涉及计算机、认...
关键词:
关键词:互联网机器翻译大数据
共2页<12>
聚类工具0