麦热哈巴·艾力
- 作品数:5 被引量:32H指数:3
- 供职机构:新疆大学更多>>
- 发文基金:国家电子信息产业发展基金国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于实例的维汉机器翻译若干关键问题研究
- 机器翻译是目前人工智能中最活跃的研究领域之一。近年来基于语料库的机器翻译方法越来越成为研究的热点。作为基于语料库机器翻译分支之一的基于实例的机器翻译(EBMT)因较经济、建立快等特点,赢得了研究者的兴趣,对其研究具有重要...
- 麦热哈巴·艾力
- 关键词:机器翻译现代汉语维吾尔语词法分析
- 文献传递
- 一种提高维吾尔语-汉语词语对齐的方法研究被引量:9
- 2012年
- 维吾尔语是典型的粘着性语言,其复杂的形态以及众多的词缀影响维吾尔语-汉语词语对齐的质量.本文提出对维吾尔语词进行形态分析并词干与词缀分离,再进行对齐;并根据维吾尔语遵循语音和谐规律的特点,对维吾尔语词缀的变体采用统一的表示方法,使得词缀呈现相同的形式.通过以上方法欲达到抑制维汉词语对齐中数据稀疏现象.本文利用此方法处理了新疆多语种信息技术重点实验室提供的维汉双语语料,再利用GIZA++进行对齐,试验结果表明,此方法对词语对齐效果起到了明显的积极作用,而且对维汉机器翻译的质量也有显著的提高.
- 麦热哈巴·艾力王志洋吐尔根·依布拉音
- 关键词:词对齐维吾尔语形态分析
- 维吾尔语词法分析的有向图模型被引量:22
- 2012年
- 维吾尔语是典型的黏着性语言,其派生能力很强,具有丰富的形态变化,同时遵循语音和谐规律,生成过程中会出现弱化、增音、脱落等音变现象.这些特性决定了维吾尔语词法分析的难点,包括词干提取、发生音变字母的还原以及标注.将维吾尔语词的层次结构引入到词法分析研究中,提出了维吾尔语词法分析的有向图模型,该模型将维吾尔语词法分析描述为有向图结构,图中节点表示词干、词缀及其相应标注,其边表示节点之间的转移或生成概率并将此概率作为候选择优的依据.针对维吾尔语在形态变化过程中发生的音变现象,又提出基于词内字母对齐算法的自动还原模型,该模型将音变现象泛化到每个字母上的假设之下,将还原问题转变成类似于词性标注问题,再利用统计方法进行还原.在对新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上进行的实验中,取得了词干提取正确率为94.7%,词干与各词缀切分并标注的F值达到92.6%的好成绩.
- 麦热哈巴·艾力姜文斌王志洋吐尔根·依布拉音刘群
- 关键词:维吾尔语词法分析词语切分词性标注有向图
- 维吾尔文智能输入法研究被引量:4
- 2013年
- 开发智能化的输入法是维吾尔文输入技术的一个发展方向,也是维吾尔文自然语言信息处理的基础性研究课题。该文根据维吾尔文自身特点,对用户输入过程中所犯各种错误进行分析,设计并实现了词语搭配知识库,提出了基于二元语法模型的一种新型维吾尔文输入算法,并给出了实现其关键模块功能的程序流程图。它具有自动预测、自动联想输入和自动校对等功能。
- 米日姑·肉孜吐尔根·依布拉音麦热哈巴·艾力
- 关键词:中文信息处理维吾尔文智能输入法语言模型
- 维吾尔语中汉族人名的识别及翻译
- 该文研究了一种维吾尔语中汉族人名的识别和翻译方法。该方法在词典等传统方法的基础上,运用语言模型实现维语中的汉族人名的识别和翻译。针对维语人名的构词和拼写特点,增加了名词词缀识别预处理模块,补充了维语字母到汉语拼音的映射规...
- 李佳正刘凯麦热哈巴·艾力吕雅娟刘群吐尔根·依布拉音
- 关键词:维吾尔语人名识别语言模型名词词缀拼写规则
- 文献传递