您的位置: 专家智库 > >

宋培岩

作品数:2 被引量:1H指数:1
供职机构:西北工业大学计算机学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇动态贝叶斯
  • 2篇动态贝叶斯网...
  • 2篇语音
  • 2篇语音识别
  • 2篇网络
  • 2篇发音
  • 2篇发音特征
  • 2篇贝叶斯
  • 2篇贝叶斯网
  • 2篇贝叶斯网络
  • 1篇视频

机构

  • 2篇西北工业大学

作者

  • 2篇蒋冬梅
  • 2篇王风娜
  • 2篇宋培岩

传媒

  • 1篇计算机应用研...
  • 1篇计算机工程与...

年份

  • 2篇2009
2 条 记 录,以下是 1-2
排序方式:
基于发音特征的音/视频双流语音识别模型被引量:1
2009年
构建了一种基于发音特征的音/视频双流动态贝叶斯网络(dynamic Bayesian network,DBN)语音识别模型,定义了各节点的条件概率关系,以及发音特征之间的异步约束关系,最后在音/视频连接数字语音数据库上进行了语音识别实验,并与音频单流、视频单流DBN模型比较了在不同信噪比情况下的识别效果。结果表明,在低信噪比情况下,基于发音特征的音/视频双流语音识别模型表现出最好的识别性能,而且随着噪声的增加,其识别率下降的趋势比较平缓,表明该模型对噪声具有很强的鲁棒性,更适用于低信噪比环境下的语音识别。
宋培岩蒋冬梅王风娜
关键词:动态贝叶斯网络发音特征语音识别
结合发音特征的动态贝叶斯网络语音识别模型
2009年
构建了一种新的基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)的异步整词-发音特征语音识别模型AWA-DBN(每个词由其发音特征的运动来描述),定义了各发音特征节点及异步检查节点的条件概率分布。在标准数字语音库Aurora5.0上的语音识别实验表明,与整词-状态DBN(WS-DBN,每个词由固定个数的整词状态构成)和整词-音素DBN(WP-DBN,每个词由其对应的音素序列构成)模型相比,WS-DBN模型虽然具有最高的识别率,但其只适用于小词汇量孤立词语音识别,AWA-DBN和WP-DBN可以为大词汇量连续语音建模,而AWA-DBN模型比WP-DBN模型具有更高的语音识别率和系统鲁棒性。
王风娜蒋冬梅宋培岩
关键词:发音特征动态贝叶斯网络语音识别
共1页<1>
聚类工具0