您的位置: 专家智库 > >

杨占磊

作品数:9 被引量:6H指数:1
供职机构:中国科学院自动化研究所更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 6篇期刊文章
  • 3篇专利

领域

  • 5篇自动化与计算...
  • 2篇电子电信

主题

  • 9篇语音
  • 9篇语音识别
  • 5篇解码
  • 4篇汉语语音识别
  • 4篇发音
  • 3篇解码方法
  • 2篇信号
  • 2篇语音识别系统
  • 2篇语音信号
  • 2篇声学模型
  • 2篇马尔科夫
  • 2篇马尔科夫模型
  • 2篇解码复杂度
  • 2篇解码算法
  • 2篇发音特征
  • 2篇复杂度
  • 1篇多层感知机
  • 1篇学界
  • 1篇音变
  • 1篇音节

机构

  • 9篇中国科学院自...
  • 5篇河南理工大学

作者

  • 9篇杨占磊
  • 9篇刘文举
  • 6篇晁浩

传媒

  • 2篇计算机应用
  • 1篇声学学报
  • 1篇计算机工程与...
  • 1篇计算机应用研...
  • 1篇计算机科学

年份

  • 3篇2014
  • 5篇2013
  • 1篇2012
9 条 记 录,以下是 1-9
排序方式:
融合引导概率的语音识别解码算法研究被引量:1
2012年
语音帧在声学特征空间中的位置信息可以辅助解码器对潜在路径进行筛选。传统的语音识别系统缺乏利用这种位置信息。针对这种不足,本文提出一种引导概率模型,用于描述语音帧属于声学特征空间不同局部的概率,并将其用于识别。使用引导概率后,解码器更强调对声学特征空间中最有希望的局部进行搜索,保留并扩展通过此局部空间的路径,同时弱化不经过此局部空间的路径。实验结果显示,融合引导概率的解码算法在不显著增加解码复杂度的情形下,使汉字相对错误率下降10.95%。结果分析表明,融合了语音帧声学位置信息的解码方法能够更有效地鉴别潜在路径,从而降低误识率。
杨占磊刘文举晁浩
关键词:语音识别系统解码算法位置信息
一种融合引导概率的语音识别优化解码方法
本发明公开了一种融合了引导概率的语音识别解码方法。针对传统的语音识别系统缺乏利用语音帧在声学特征空间中的位置信息不足,本发明提出一种引导概率模型,用于描述语音帧属于声学特征空间不同局部的概率,并用于指导解码过程。本发明的...
刘文举杨占磊
文献传递
一种发音稳定段辅助的语音识别优化解码方法及装置
本发明公开了一种基于发音稳定段的语音识别解码方法。针对语音识别解码过程复杂度较高的问题,本发明提出利用语音的稳定性信息改善解码过程中路径扩展的方式,达到降低解码复杂度的目的。本发明的方案包括下列步骤:对语音信号计算语谱图...
刘文举杨占磊
汉语语音识别中融合发音信息的随机段模型研究被引量:1
2014年
提出了一种基于随机段模型的发音信息集成方法。根据随机段模型的模型特性,建立了阶层式人工神经网络来获取语音段信号属于各类音素的后验概率,并通过一遍解码的方式集成到随机段模型系统中。在"863-test"测试集上进行的汉语连续语音识别实验显示汉语字的相对错误率下降了5.93%。实验结果表明了将发音信息应用到随机段模型的可行性。
晁浩杨占磊刘文举
关键词:语音识别发音特征
汉语语音识别中声学界标点引导的随机段模型解码算法被引量:1
2013年
提出了一种随机段模型的解码优化算法。检测出具有语音学意义的界标点,根据这些界标点分析临近语音段的边界信息和声韵母类别信息,最后将这些边界信息和类别信息用于指导随机段模型的搜索过程。实验中,两种类型的界标点能较为准确地被检测出来,并用于指导随机段模型的解码,在"863-test"测试集上进行的汉语连续语音识别实验显示,在正确率只有轻微下降的同时,解码时间下降了12.92%,这表明了将语音学知识引入语音识别系统的有效性。
晁浩杨占磊刘文举
关键词:语音识别解码
基于最大似然线性回归的随机段模型说话人自适应研究
2014年
提出了一种随机段模型系统的说话人自适应方法。根据随机段模型的模型特性,将最大似然线性回归方法引入到随机段模型系统中。在"863-test"测试集上进行的汉语连续语音识别实验显示,在不同的解码速度下,说话人自适应后汉字错误率均有明显的下降。实验结果表明,最大似然线性回归方法在随机段模型系统中同样能取得较好的效果。
晁浩杨占磊刘文举
关键词:语音识别说话人自适应
一种发音稳定段辅助的语音识别优化解码方法及装置
本发明公开了一种基于发音稳定段的语音识别解码方法。针对语音识别解码过程复杂度较高的问题,本发明提出利用语音的稳定性信息改善解码过程中路径扩展的方式,达到降低解码复杂度的目的。本发明的方案包括下列步骤:对语音信号计算语谱图...
刘文举杨占磊
文献传递
汉语语音识别中基于音节的声学模型改进算法被引量:1
2013年
针对汉语语音识别中协同发音现象引起的语音信号的易变性,提出一种基于音节的声学建模方法。首先建立基于音节的声学模型以解决音节内部声韵母之间的音变现象,并提出以音节内双音子模型来初始化基于音节声学模型的参数以缓解训练数据稀疏的问题;然后引入音节之间的过渡模型来处理音节之间的协同发音问题。在"863-test"测试集上进行的汉语连续语音识别实验显示汉语字的相对错误率下降了12.13%,表明了基于音节的声学模型和音节间过渡模型相结合在解决汉语协同发音问题上的有效性。
晁浩杨占磊刘文举
关键词:语音识别协同发音音变声学建模
基于发音特征的汉语声调建模方法及其在汉语语音识别中的应用被引量:2
2013年
发音特征表征了语音的发音方式信息,能够辅助传统的韵律特征改善声调建模的精度。在分析汉语声韵母发音特点的基础上,将发音方式划分为19类,并提出利用阶层式多层感知器计算语音信号属于各类的后验概率,作为发音特征。之后,将发音特征与传统的韵律特征一起用于声调建模。实验结果显示,加入发音特征后,在三种不同的建模方法下声调识别的准确率提升约5%。将声调模型融入大词表连续语音识别系统后,汉字错误率有了明显的下降。
晁浩杨占磊刘文举
关键词:语音识别发音特征
共1页<1>
聚类工具0