您的位置: 专家智库 > >

麦热哈巴艾力

作品数:15 被引量:42H指数:5
供职机构:新疆大学信息科学与工程学院更多>>
发文基金:国家自然科学基金国家社会科学基金教育部人文社会科学研究基金更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 14篇期刊文章
  • 1篇会议论文

领域

  • 12篇自动化与计算...
  • 3篇语言文字

主题

  • 13篇维吾尔
  • 12篇维吾尔语
  • 5篇翻译
  • 4篇机器翻译
  • 3篇动词
  • 3篇语言模型
  • 3篇词尾
  • 2篇对齐
  • 2篇语言处理
  • 2篇统计机器
  • 2篇统计机器翻译
  • 2篇拼写
  • 2篇自然语言
  • 2篇自然语言处理
  • 2篇名词
  • 2篇词对齐
  • 2篇词法分析
  • 1篇动词形态
  • 1篇对数似然比
  • 1篇信息处理

机构

  • 15篇新疆大学
  • 3篇中国科学院

作者

  • 15篇麦热哈巴艾力
  • 4篇麦合甫热提
  • 2篇艾山吾买尔
  • 2篇姜文斌
  • 1篇吕雅娟
  • 1篇刘群
  • 1篇刘凯
  • 1篇李佳正

传媒

  • 4篇中文信息学报
  • 3篇计算机工程与...
  • 2篇中央民族大学...
  • 1篇语言与翻译
  • 1篇计算机工程
  • 1篇计算机工程与...
  • 1篇新疆大学学报...
  • 1篇科技信息

年份

  • 1篇2018
  • 3篇2015
  • 5篇2014
  • 3篇2013
  • 1篇2012
  • 2篇2011
15 条 记 录,以下是 1-10
排序方式:
提高少数民族学生打字速度的探索及实践被引量:1
2013年
计算机打字是现代大学生应具备的一项基本技能。本文根据少数民族学生自身条件和学校配备教学条件,探索如何提高少数民族学生打字速度的方法,将打字与现行课程融合,采用多种手段尽量在课堂上让学生学到正确的指法并在老师的监督下练习打字。在一个学期的授课实践过程中采用以上方法,取得了不错的效果。
麦热哈巴艾力
关键词:指法
基于词典和统计相结合的维吾尔语拼写检查方法被引量:2
2014年
该文通过研究国内外相关的拼写错误查错和纠错方法的理论,再结合维吾尔语自身的特点,提出了基于词典和统计相结合的维吾尔语拼写查错方法。首先,提出基于词典的方法进行词库和词干提取的拼写检查;其次,提出基于N元语法的词缀连接有效性判断模型,对未登录词提出基于N元语法的拼写检查模型;最后,结合以上几种方法各自的优点提出基于混合策略的拼写检查方法,该方法在准确性和检查结果可靠性等方面得到了较显著的提高。
麦合甫热提艾山吾买尔麦热哈巴艾力吐尔根.伊布拉音张健
关键词:维吾尔语拼写检查词典N元语法
维吾尔语动词词目还原实现方法及存在的问题
2013年
文章按照计算语言学的理论和方法对维吾尔语动词的词目还原工作进行分析并提出了尚存的问题。
阿孜古丽.夏力甫麦热哈巴艾力
关键词:维吾尔语动词
基于语法语义知识的维吾尔文机构名识别被引量:7
2014年
为了提高维吾尔语中机构名的自动识别准确率,从维吾尔语的语言特点出发,对维吾尔语中机构名的组织结构进行了分类并将其形式化表示;根据此特征设计出有效地识别规则,创建了特征词库、地名库和修饰词库等知识库;设计并实现了基于状态转移原理的高效识别算法。实验结果表明,该算法识别的F值达到83.05%,获得了较好结果。
麦合甫热提米日姑.肉孜麦热哈巴艾力吐尔根.依布拉音
关键词:自然语言处理命名实体识别机构名识别
新疆大学CWMT2011评测技术报告
本文主要介绍了我们参加CWMT2011研讨会的参评系统和技术报告,我们参加的项目是面向新闻领域的维汉机器翻译、面向新闻领域的哈汉机器翻译以及面向新闻领域的柯汉机器翻译等三个项目.本文中详细的介绍了系统的主要流程以及细节。
麦热哈巴艾力米日古.肉孜撒依达江阿古丽吐尔根.伊布拉音
关键词:统计机器翻译语言模型词法分析
文献传递
维吾尔语词尾对汉维统计机器翻译影响的研究被引量:7
2014年
维吾尔语属于阿尔泰语系,是典型的黏着语,构形词尾在维吾尔语中占很重要的地位,这与汉语差别很大。针对维吾尔语的形态特点,分析汉维统计机器翻译中维吾尔语构形词尾的作用,利用Cherio搭建一个基于层次短语的汉维统计机器翻译系统。使用词级粒度、词干级粒度、词干词尾级粒度的汉维平行语料进行对比实验,探讨不同粒度对汉维统计机器翻译系统的影响。实验结果表明,该汉维统计机器翻译系统可以提高汉维统计翻译的质量,BLEU值达到0.1972。
米莉万.雪合来提麦热哈巴艾力吐尔根.依布拉音姜文斌
关键词:词尾统计机器翻译语言模型
维吾尔语词法中音变现象的自动还原模型被引量:8
2012年
该文针对维吾尔语的音变现象,提出了一种自动还原模型。与以往方法不同的是,此模型中我们把音变现象泛化,先假设维吾尔语中所有语音都有音变现象,从而将还原问题转化为类似于词性标注问题,再利用标注的方法解决了还原操作。在新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上做了实验,还原模块作为维吾尔语词法分析器的一部分,把词法分析器功能的F值从84.1%提高到了91.4%,同时维吾尔语中词缀数目最多、变形情况最复杂的动词词干的还原正确率也达到了88.6%,实际应用中完全可以被接受。
麦热哈巴艾力姜文斌姜文斌
关键词:维吾尔语词法分析
基于词干提取的维吾尔语事件类时间短语识别被引量:6
2014年
针对维吾尔语事件类时间短语没有明显时间词特征词而引起的识别困难和边界定位不准确等问题,提出了一种统计结合词干提取的针对黏着性语言的事件类时间短语的识别方法。根据维吾尔语典型的黏着性语言形态特点,对时间短语构成进行分析和分类,采用机器学习的方法将难于识别的事件类隐性时间短语识别问题转换为基于统计方法的序列标注;通过对维吾尔语事件类时间要素分析及维吾尔语构词的研究,引入黏着语特有的词干特征,选定实验特征集合,对比分析不同的特征集合的自动识别准确率的平均值。实验结果表明,该方法对维吾尔语事件类时间短语识别的F-值达到85.37%。这一结果对其它黏着性语言的研究具有参考意义。
邹岳琳吐尔根.依布拉音麦热哈巴艾力艾山吾买尔帕力旦.吐尔逊
关键词:自然语言处理条件随机场词干提取
维吾尔语多词表达抽取方法研究被引量:3
2014年
多词表达是特殊的语言现象,一般由多个词构成来表示一个意义,语料中常出现在一起。多词表达因是特殊的单元,其抽取在自然语言处理的很多领域有着非常重要的作用。讨论了目前常见的三种统计方法即互信息、对数似然比以及卡方等在维吾尔语多词表达抽取方面的影响。根据维吾尔语的特点,将词干作为一项特征加到抽取方法中。语料的选择上考虑了覆盖面及领域,并探讨了它们对抽取方法的影响。
麦热哈巴艾力阿孜古丽.夏力甫吐尔根.依布拉音
关键词:互信息对数似然比维吾尔语
维吾尔语不同词尾粒度对维汉词对齐的影响被引量:2
2015年
维吾尔语中,词的复杂形态是导致数据稀疏问题的主要原因,为降低数据稀疏对词对齐和机器翻译的不良影响,尽可能挖掘词尾携带的语义信息,提出对词尾采取"分离-丢弃"方案。根据统计分析,对维吾尔语词进行词干、词尾分离后,对其语义信息被明文翻译概率高的词尾采取"分离"方案,概率低的词尾采取"丢弃"方案。将该方案应用到维吾尔语名词和动词上,分等级构造9种模板进行实验,实验结果表明,该方案抑制了词干、词尾分离带来的句子长度过长问题,增加了维汉词对的数量,提高了维汉机器翻译质量,验证了该方案的有效性。
麦合甫热提麦热哈巴艾力米莉万.雪合来提
关键词:词对齐形态分析
共2页<12>
聚类工具0