您的位置: 专家智库 > >

汪昆

作品数:5 被引量:29H指数:3
供职机构:中国科学院自动化研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 2篇专利

领域

  • 3篇自动化与计算...

主题

  • 3篇短语
  • 3篇机器翻译
  • 3篇翻译
  • 3篇翻译记忆
  • 2篇短语翻译
  • 2篇音节
  • 2篇双语
  • 2篇统计机器
  • 2篇统计机器翻译
  • 1篇译文
  • 1篇译文质量
  • 1篇人名
  • 1篇人名识别
  • 1篇随机场
  • 1篇条件随机场
  • 1篇最大熵
  • 1篇维吾尔
  • 1篇维吾尔语
  • 1篇规则相
  • 1篇藏文

机构

  • 5篇中国科学院自...
  • 1篇新疆大学
  • 1篇中央研究院
  • 1篇西北民族大学

作者

  • 5篇汪昆
  • 3篇宗成庆
  • 3篇苏克毅
  • 1篇于洪志
  • 1篇艾斯卡尔艾木...
  • 1篇李亚超
  • 1篇冷本扎西

传媒

  • 2篇中文信息学报
  • 1篇自动化学报

年份

  • 1篇2017
  • 1篇2016
  • 1篇2015
  • 2篇2013
5 条 记 录,以下是 1-5
排序方式:
统计机器翻译和翻译记忆的动态融合方法研究被引量:5
2015年
在融合翻译记忆和统计机器翻译的整合式模型的基础上,该文提出在解码过程中进一步地动态加入翻译记忆中新发现的短语对。它在机器翻译解码过程中,动态地加入翻译记忆片段作为候选,并利用翻译记忆的相关信息,指导基于短语的翻译模型进行解码。实验结果表明该方法显著提高了翻译质量:与翻译记忆系统相比,该方法提高了21.15个BLEU值,降低了21.47个TER值;与基于短语的翻译系统相比,该方法提高了5.16个BLEU值,降低了4.05个TER值。
汪昆宗成庆苏克毅
关键词:统计机器翻译翻译记忆
一种融合翻译记忆和短语翻译模型的统计机器翻译方法
本发明公开了一种融合翻译记忆和短语翻译模型的统计机器翻译方法,其包括:步骤1:利用训练集得到双语短语切分句对;步骤2:根据所得到的双语短语切分句对获得翻译记忆中相应的翻译记忆短语对,并抽取翻译记忆短语对的相关特征;步骤3...
汪昆宗成庆苏克毅
文献传递
一种融合翻译记忆和短语翻译模型的统计机器翻译方法
本发明公开了一种融合翻译记忆和短语翻译模型的统计机器翻译方法,其包括:步骤1:利用训练集得到双语短语切分句对;步骤2:根据所得到的双语短语切分句对获得翻译记忆中相应的翻译记忆短语对,并抽取翻译记忆短语对的相关特征;步骤3...
汪昆宗成庆苏克毅
文献传递
统计与规则相结合的维吾尔语人名识别方法被引量:9
2017年
命名实体识别(Named entity recognition,NER)是自然语言处理(Natural language processing,NLP)中重要的任务,其中人名实体是主要的识别对象之一.本文从维吾尔语黏着性特点出发,从词干、音节、字符串三个角度对维吾尔语单词进行拆分,获得更小的语言单元,并把切分的新单元作为特征加入到条件随机场(Conditional random field,CRF)中,明显缓解了数据稀疏的影响,取得了比以单词为基本单元的人名识别方法更好的性能.同时还从维吾尔语中汉族人名的特点出发,提出了基于规则的维吾尔语中汉族人名的识别方法,最终利用统计和规则相结合的方法进一步提高了识别的准确率.实验结果表明,该方法人名识别的准确率、召回率和F1值分别达到了87.47%、89.12%和88.29%.
塔什甫拉提.尼扎木丁汪昆艾斯卡尔艾木都拉帕力旦.吐尔逊
关键词:维吾尔语人名识别条件随机场
融合音节特征的最大熵藏文词性标注研究被引量:15
2013年
藏文词性标注是藏文信息处理中非常重要的基础性问题,该文以最大熵模型为基本框架,根据藏文的构词特征及统计分析结果,定义并选取特征模板,研究了融合语言特征的最大熵藏文词性标注模型。实验结果表明,最大熵模型能够较好的处理藏文词性标注问题,音节特征可以显著提高藏文词性标注的效果,与基准系统相比使错误率降低了6.4%。
于洪志李亚超汪昆冷本扎西
关键词:藏文词性标注最大熵
共1页<1>
聚类工具0