您的位置: 专家智库 > >

雪艳

作品数:12 被引量:21H指数:2
供职机构:中央民族大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中国科学院知识创新工程重要方向项目更多>>
相关领域:语言文字自动化与计算机技术更多>>

文献类型

  • 7篇会议论文
  • 4篇期刊文章
  • 1篇学位论文

领域

  • 7篇语言文字
  • 6篇自动化与计算...

主题

  • 6篇对齐
  • 5篇语料
  • 5篇语料库
  • 4篇词语对齐
  • 3篇蒙古语
  • 3篇机器翻译
  • 3篇翻译
  • 2篇信息处理
  • 2篇语言
  • 2篇平行语料
  • 2篇平行语料库
  • 2篇现代蒙古语
  • 2篇词对齐
  • 2篇词语
  • 1篇对齐方法
  • 1篇对应表
  • 1篇形态学
  • 1篇语料库加工
  • 1篇语言学
  • 1篇语言组织

机构

  • 10篇内蒙古大学
  • 5篇中央民族大学
  • 3篇中国科学院
  • 2篇北京大学
  • 1篇中国科学技术...

作者

  • 12篇雪艳
  • 5篇那顺乌日图
  • 2篇应玉龙
  • 1篇杨攀
  • 1篇李淼
  • 1篇姜迎春
  • 1篇乌达巴拉
  • 1篇张建
  • 1篇叶嘉明

传媒

  • 1篇内蒙古大学学...
  • 1篇计算机应用
  • 1篇中文信息学报
  • 1篇民族翻译
  • 1篇第二届全国少...
  • 1篇第三届全国少...
  • 1篇第十届全国少...
  • 1篇第五届全国机...
  • 1篇第二届双边蒙...

年份

  • 1篇2011
  • 3篇2010
  • 4篇2009
  • 1篇2008
  • 1篇2006
  • 2篇2005
12 条 记 录,以下是 1-10
排序方式:
汉蒙统计机器翻译中的形态学方法研究被引量:12
2009年
该文将形态学方法引入到汉蒙统计机器翻译的研究中,尝试解决译文词形选择及语序混乱问题。首先介绍语料库的准备:对原始汉蒙平行语料库进行词法分析及标注,得到两组基础语料库,再由基础语料库生成两组用于形态学实验的派生语料库。其次阐述统计模型的训练,包括语言模型、翻译模型及生成模型。同时讨论了解码的扩展问题。最后重点分析两组形态学方法实验:词素模型实验和factored方法实验。结果表明,相对于基线(baseline)实验,引入形态学方法后两组实验的BLEU评分均有所提高,译文词形选择及语序混乱问题得到了一定程度的解决。
杨攀张建李淼乌达巴拉雪艳
关键词:计算机应用中文信息处理形态学统计机器翻译语料库统计模型
词语对齐方法研究概述以及关于汉蒙词语对齐的一些思考
20世纪90年代初,词语对齐作为统计机器翻译的中间产物引起了人们最初的关注。随着词语对齐的应用价值在更为广泛的领域得到认可,它不再局限于统计机器翻译的研究框架,而逐渐成为了一个独立的研究方向。近20年来,词语对齐的相关研...
雪艳
关键词:汉语蒙语
文献传递
词语对齐与机器翻译问题研究——以汉蒙机器翻译为例被引量:1
2010年
目前基于实例的机器翻译方法和统计机器翻译方法被视为机器翻译界主流译法。本文试图结合以上两种方法为例说明实现词语对齐(Word Alignment)对机器翻译等工作流程中的重要性和必要性问题。
姜迎春姜迎春
关键词:词语对齐机器翻译平行语料库
蒙古语连续多词单元的识别和标注
本文提出一种蒙古语连续多词单元(Consecutive Multi-WordUnits)的自动识别方法,用以辅助语言学工作者在蒙古语文本中对连续多词单元进行识别和标注。首先结合汉蒙词语对齐任务,讨论对蒙古语多词单元进行识...
雪艳那顺乌日图
文献传递
汉蒙词语对齐及相关技术研究
汉蒙平行语料库是包含汉语和蒙古语两种语言互译文本的语料库,它是蒙古文信息处理数据资源的重要组成部分。汉蒙平行语料库在语言的多个层面上呈现汉语和蒙古语的互译对照信息,能够为汉蒙机器翻译或者其他与汉蒙双语相关的信息处理提供强...
雪艳
关键词:信息处理平行语料库
现代蒙古语语料库加工技术的新进展--新一代蒙古语词语自动切分与标注系
鉴于现代蒙古语语料库加工的新需要,内蒙古大学蒙古学学院和北京大学计算语言学研究所合作开发了新一代蒙古语词语自动切分标注系统.本文在对新旧系统进行比较的基础上,着重介绍了新系统的核心组成部分,及其在标注方面的特点.
那顺乌日图雪艳叶嘉明
关键词:蒙古语语料库加工
文献传递网络资源链接
现代蒙古语语料库加工技术的新进展——新一代蒙古语词语自动切分与标注系(Darhan Tagging System)
鉴于现代蒙古语语料库加工的新需要,内蒙古大学蒙古学学院和北京大学计算语言学研究所合作开发了新一代蒙古语词语自动切分标注系统。本文在对新旧系统进行比较的基础上,着重介绍了新系统的核心组成部分,及其在标注方面的特点。
那顺乌日图雪艳叶嘉明
关于用XML语言组织蒙古语语料库的设想被引量:4
2006年
目前,在蒙古语语料库数据管理上还存在元数据信息不完整、格式不统一等问题,这不仅不利于语料的管理和升级,对今后建立蒙古语语料库网络共享资源也会造成阻碍。针对这种情况,可以用XML语言组织蒙古语语料。
雪艳
关键词:蒙古语语料库XML语言
基于阿拉伯数字中介的汉蒙数词对齐策略
在汉蒙词对齐任务的背景下,我们针对数词这一特殊的词类,提出了以阿拉伯数字作为转换中介的对齐方法。其基本思想是,将汉蒙文本中的数词分别转换为阿拉伯数字后再决定它们之间是否存在对应关系,即是否可以成为一个对齐连接。转换过程建...
雪艳应玉龙
文献传递
汉蒙词法对比与汉蒙词语对齐方法研究
本文对汉语和蒙古语进行词法层面的对比研究,寻找可以为汉蒙词语对齐所利用的语言学知识,并以基于双语词典的Greedy算法作为基本框架,通过前后加工的方式将相关语言学知识引入其中,研究外部知识对于汉蒙词语对齐起到的实际作用。
雪艳那顺乌日图
关键词:机器翻译词语对齐语言学
文献传递
共2页<12>
聚类工具0