闫学亮 作品数:7 被引量:13 H指数:3 供职机构: 内蒙古大学计算机学院 更多>> 发文基金: 内蒙古自治区自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 语言文字 更多>>
基于分割识别的蒙古语语音关键词检测方法的研究 被引量:2 2013年 蒙古文属于黏着语,词根和后缀能够组合成近百万的蒙古文单词。现有的蒙古语大词汇量连续语音识别(LVCSR)系统的发音词典无法包含所有蒙古文单词。同时发音词典较大时,训练语料的稀疏将导致LVCSR系统的性能明显下降。为了解决LVCSR系统中大多数蒙古文单词的识别问题和蒙古语语音关键词检测系统中大量集外词的检测问题,结合蒙古文的构词特点,提出了基于分割识别的蒙古语LVCSR方法,并建立了对应的声学模型和语言模型。最后,将此方法应用到了蒙古语语音关键词检测系统中并在蒙古语语音语料上进行了测试。实验结果表明,基于分割识别的蒙古语LVCSR方法能解决大部分蒙古文单词的识别问题,并将蒙古语语音关键词检测系统的大量集外词转化成了集内词,大幅度提高了检测系统的查准率和召回率。 飞龙 高光来 闫学亮 王炜华关键词:蒙古语 词干 关键词检测 混淆网络 蒙古文字母到音素转换方法的研究 被引量:4 2013年 针对蒙古文字母到音素的转换(grapheme to phoneme conversion,G2P)问题,提出了基于规则的蒙古文G2P转换方法和基于联合序列模型的蒙古文G2P转换方法。实验结果表明,利用联合序列模型的蒙古文G2P转换方法要明显好于基于规则的蒙古文G2P转换方法。并且建立的基于联合序列模型的蒙古文G2P转换系统的词误识率为16.32%,音素误识率仅为3.37%,能达到实用要求。 飞龙 高光来 闫学亮关键词:蒙古文 传统蒙古文与西里尔蒙古文相互转换方法的研究 被引量:4 2014年 传统蒙古文和西里尔蒙古文分别是在中国和蒙古国使用的蒙古文,它们的口语基本相同,但是书写形式完全不同。结合传统蒙古文和西里尔蒙古文的构词特点,提出了基于联合序列模型的传统蒙古文和西里尔蒙古文相互转换方法,并做了大量的相互转换实验。实验中,传统蒙古文到西里尔蒙古文转换系统的词误识率和字母误识率分别达到了18.38%和6.75%,西里尔蒙古文到传统蒙古文转换系统的词误识率字母误识率分别达到了18.77%和7.14%,基本达到了实用要求。 飞龙 高光来 闫学亮 魏宏喜蒙古文依存句法分析 被引量:3 2014年 近年来,依存句法分析逐渐成为自然语言处理领域中的研究热点。然而,蒙古文的依存句法分析尚未得到足够的重视。基于最大生成树模型在蒙古文依存关系树库TMDT上进行了蒙古文依存句法分析的研究。在简要介绍蒙古文的特点和蒙古文依存关系树库TMDT之后,详细讨论了最大生成树模型。为找到该模型在蒙古文依存句法分析中合适的特征,重点通过实验对8种特征及其组合在句法分析中的性能进行了比较。结果显示,Basic Unigram Features、Basic Bi-gram Features以及C-C sibling Features这3种特征的组合性能最佳。本研究为蒙古文依存句法分析奠定了基础。 苏向东 高光来 闫学亮关键词:蒙古文 依存句法分析 最大生成树 自然语言处理 信息检索查询词权分配方法的研究 因特网的发展使得人们可访问的信息资源越来越多,远远超过了人工筛选的处理能力,人们迫切的需要一种能够快速准确地为其找到所需信息的手段。信息检索这个研究领域正是应此需求而诞生的。信息检索所关心的问题是:信息的表达,存储,组织... 闫学亮关键词:信息检索 隐马尔可夫模型 文献传递 信息检索查询词权重分配方法的研究 因特网的发展使得人们可访问的信息资源越来越多,远远超过了人工筛选的处理能力,人们迫切的需要一种能够快速准确地为其找到所需信息的手段。信息检索这个研究领域正是应此需求而诞生的。信息检索所关心的问题是:信息的表达,存储,组织... 闫学亮关键词:信息检索 隐马尔可夫模型 蒙古文依存句法分析 近年来,依存句法分析逐渐成为自然语言处理领域中的研究热点.然而,蒙古文的依存句法分析尚未得到足够的重视.基于最大生成树模型在蒙古文依存关系树库TMDT上进行了蒙古文依存句法分析的研究.在简要介绍蒙古文的特点和蒙古文依存关... 苏向东 高光来 闫学亮关键词:蒙古文 依存句法分析 最大生成树 自然语言处理 文献传递