国家自然科学基金(61263037)
- 作品数:11 被引量:25H指数:3
- 相关作者:高光来包希日莫赵建东闫蓉张璟更多>>
- 相关机构:内蒙古大学西安理工大学蒙特利尔大学更多>>
- 发文基金:国家自然科学基金内蒙古自治区自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于历史模型的蒙古文自动词性标注研究被引量:1
- 2013年
- 蒙古文自动词性标注方面的研究工作较少,制约了对蒙古文的机器翻译、语法分析及语义分析等领域的深入研究。针对于此,提出了加入lookahead学习机制的基于历史模型的蒙古文自动词性标注方法。实验表明,加入lookahead学习机制的基于历史模型的蒙古文自动词性标注方法对蒙古文的未登录词、集内词、总体词自动词性标注的准确率分别达到了71.276 6%、99.148 2%、95.301 0%,说明此方法可以较好地进行蒙古文的自动词性标注。
- 赵建东高光来飞龙
- 关键词:LOOKAHEAD蒙古文
- 一种融合语义距离的最近邻图像标注方法被引量:5
- 2015年
- 传统的基于最近邻的图像标注方法效果不佳,主要原因在于提取图像视觉特征时,损失了很多有价值的信息。提出了一种改进的最近邻分类模型。首先利用距离测度学习方法,引入图像的语义类别信息进行训练,生成新的语义距离;然后利用该距离对每一类图像进行聚类,生成多个类内的聚类中心;最后通过计算图像到各个聚类中心的语义距离来构建最近邻分类模型。在构建最近邻分类模型的整个过程中,都使用训练得到的语义距离来计算,这可以有效减少相同图像类内的变动和不同图像类之间的相似所造成的语义鸿沟。在ImageCLEF2012图像标注数据库上进行了实验,将本方法与传统分类模型和最新的方法进行了比较,验证了本方法的有效性。
- 吴伟高光来聂建云
- 关键词:图像标注特征提取最近邻语义距离
- 蒙古文依存句法分析被引量:3
- 2014年
- 近年来,依存句法分析逐渐成为自然语言处理领域中的研究热点。然而,蒙古文的依存句法分析尚未得到足够的重视。基于最大生成树模型在蒙古文依存关系树库TMDT上进行了蒙古文依存句法分析的研究。在简要介绍蒙古文的特点和蒙古文依存关系树库TMDT之后,详细讨论了最大生成树模型。为找到该模型在蒙古文依存句法分析中合适的特征,重点通过实验对8种特征及其组合在句法分析中的性能进行了比较。结果显示,Basic Unigram Features、Basic Bi-gram Features以及C-C sibling Features这3种特征的组合性能最佳。本研究为蒙古文依存句法分析奠定了基础。
- 苏向东高光来闫学亮
- 关键词:蒙古文依存句法分析最大生成树自然语言处理
- 基于遗传算法的声学模型拓扑结构优化被引量:6
- 2014年
- 针对当前创建语音识别系统时只能采用经验式或启发式方法选择声学模型拓扑结构的情形,提出了一个基于标准遗传算法的声学模型拓扑结构优化算法。与以往的类似应用相比,该算法具备同时优化模型状态数与各状态高斯核数和摒弃高斯核均匀分配的特点。连续数字串TIDigits语料上的以贝叶斯信息准则为目标函数的实验表明,与传统方法创建的基线系统相比,模型拓扑优化的系统能够以较低的复杂度获得较高的识别率,这说明该算法是声学模型拓扑结构优化的有效工具。
- 包希日莫高光来张璟
- 关键词:隐马尔可夫模型遗传算法语音识别贝叶斯信息准则
- 基于检索结果排序的伪相关反馈被引量:1
- 2016年
- 针对传统伪相关反馈(PRF)算法扩展源质量不高使得检索效果不佳的问题,提出一种基于检索结果的排序模型(REM)。首先,该模型从初检结果中选择排名靠前的文档作为伪相关文档集;然后,以用户查询意图与伪相关文档集中各文档的相关度最大化、并且各文档之间相似性最小化作为排序原则,将伪相关文档集中各文档进行重排序;最后,将排序后排名靠前的文档作为扩展源进行二次反馈。实验结果表明,与两种传统伪反馈方法相比,该排序模型能获得与用户查询意图相关的反馈文档,可有效地提高检索效果。
- 闫蓉高光来
- 关键词:主题模型查询扩展
- 蒙古语声学模型状态聚类:问题集设计被引量:1
- 2013年
- 针对蒙古语语音识别系统急待设计出相应问题集的现状,讨论了蒙古语问题集设计中的原则、音子集的选择、音素表的完善、复合元音的归类、松与紧概念的应用等关键问题的解决方案,给出了一个蒙古语标准音问题集.多次对比实验结果表明,该蒙古语问题集能够有效支持基于决策树的状态聚类与绑定方法.
- 包希日莫高光来
- 关键词:蒙古语决策树声学模型
- 蒙古语语音合成语料库标注规则的设计
- 2013年
- 在蒙古语语音合成系统中,语料库的好坏会直接影响语音合成的效果.因此,语料库标注规则的设计对语音合成工作具有重要意义.提出了一种新的蒙古语语音合成语料库的标注规则,并用按此规则标注的蒙古语语料库进行了基于隐马尔科夫模型的蒙古语语音合成实验,合成效果达到了预期目标,说明我们提出的标注规则是合理可靠的.
- 赵建东高光来飞龙
- 关键词:蒙古语语料语音合成
- 基于BIC与PSO的简约语音识别系统创建被引量:1
- 2013年
- 针对当前尚无建立简约高效语音识别系统标准方法的情形,提出了通过贝叶斯信息准则(Bayesian InformationCriterion,BIC)中的权衡系数折中选择系统识别率与复杂度,利用改进的粒子群优化(Particle Swarm Optimization,PSO)算法优化声学模型拓扑结构,进而创建高效简约语音识别系统的新方法。TIDigits上的实验表明,与传统方法创建的同复杂度的基线系统相比,用该方法建立的新系统句子正确率提升了7.85%,与同识别率的基线系统相比,系统复杂度降低了51.4%,说明新系统能够以较低的复杂度获得较高的识别率。
- 包希日莫高光来张璟
- 关键词:语音识别贝叶斯信息准则粒群优化
- 基于条件随机场的蒙古语韵律短语预测方法
- 韵律预测是提高语音合成自然度的重要因素。蒙古语语音合成技术的研究仍处于起步阶段,合成语音的自然度较低,韵律预测成为了蒙古语语音合成亟待解决的关键问题。本文结合蒙古语语音学特点,将蒙古语单词、词性作为特征,采用条件随机场模...
- 刘瑞飞龙高光来张红伟
- 关键词:蒙古语条件随机场语音合成
- 文献传递
- 上下文边界可变的词义消歧被引量:2
- 2015年
- 传统基于知识的词义消歧方法对所有词性的多义词均采用统一窗口大小作为消歧上下文,没有考虑固定窗口中影响消歧的噪音问题,消歧效果不佳,为此提出一种上下文边界可变的中文词义消歧模型。通过分词性的调整消歧上下文边界,尽可能保证选取的上下文中各词语和多义词存在语义联系,达到消减噪音目的。通过构建多义词义项搭配库,进一步细化词语间语义相关度计算。实验结果表明,使用该方法比SemEval-2007最好成绩高出8.6个百分点。
- 闫蓉高光来
- 关键词:语境语义相关搭配词义消歧知网