国家重点基础研究发展计划(2007CB316503)
- 作品数:5 被引量:28H指数:3
- 相关作者:刘群李锦涛侯宏旭孟和吉雅白音门德更多>>
- 相关机构:内蒙古大学中国科学院中国科学院研究生院更多>>
- 发文基金:内蒙古自治区自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 非标准蒙古文字符编码转换为国际编码的一种方法被引量:4
- 2008年
- 蒙古文信息处理由于诸多原因,造成多种编码共存,现有的大量信息资源无法共享.大多数系统的蒙古文编码以蒙古文显现字符为基本编码单位,属于字形编码.本文讨论的问题是首先将不同种类的蒙古文字形编码转换为蒙古文最小字素编码,再根据蒙古文正字法对照词典及有关规则,转换为蒙古文国际编码.
- 巩政郝莉杨旭华
- 关键词:蒙古文
- 基于统计语言模型的蒙古文词切分被引量:16
- 2009年
- 通过对蒙古文词切分技术的分析,利用规则作为切分的基础,提出一种统计和规则相结合的蒙古文词切分方法.这种方法利用蒙古语统计语言模型作为排歧依据,使用的语言模型有基于词性的语言模型和Skip-N语言模型.其词切分准确率比基于规则的系统有较大提高.
- 侯宏旭刘群那顺乌日图牧仁高娃李锦涛
- 关键词:蒙古语语言模型
- 一种基于短语的汉蒙统计机器翻译与调序模型被引量:4
- 2009年
- 根据蒙古语的一些特点,为基于短语的汉蒙统计机器翻译提出了一种适合于汉蒙统计机器翻译的调序模型,并给出了相应的训练和解码算法以及初步实验的结果。汉蒙双语语料库规模很小,数据稀疏问题严重,而在汉蒙翻译中,词序变化又非常明显,在汉英等机器翻译中使用的调序方法难于应用到汉蒙统计机器翻译中。通过对汉蒙翻译过程中词语顺序变化的正态分布假设,建立了一种概率调序模型。实验表明,这种概率调序模型好于 Moses系统中采用的调序方法。
- 侯宏旭刘群李锦涛
- 关键词:机器翻译蒙古语
- 基于词干词缀的蒙古语语音合成方法被引量:1
- 2008年
- 讨论以蒙古语的词干和词缀作为语音基元,使用硬拼接和软拼接相结合的方法进行拼接,然后采用时域基音同步叠加(TD-PSOLA)和频域基音同步叠加法(FD-PSOLA)对合成语音的韵律进行调整的蒙古语语音合成思路和方法.
- 孟和吉雅白音门德敖其尔
- 关键词:语音合成词干词缀
- 基于语音特征比较的蒙古语标准音测试系统研究被引量:3
- 2008年
- 在蒙古语标准音的水平测试过程中,人们对测试结果存在一些分歧.为了消除测试结果的这些分歧,提出了用基于语音特征比较的蒙古语标准音测试软件来辅助测试的思路.通过对输入的测试语音进行分析,提取语音特征并与参考的标准音进行匹配比较,根据相似程度大小给出测试结果.软件在屏幕上绘制出语音的波形,共振峰等图形,可以更直接的反映出被比较的两个语音间的差别.
- 孟和吉雅白音门德
- 关键词:蒙古语波形标准音