您的位置: 专家智库 > >

万书婷

作品数:1 被引量:3H指数:1
供职机构:西北工业大学更多>>
发文基金:西北工业大学研究生创业种子基金陕西省自然科学基金更多>>
相关领域:电子电信更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇电子电信

主题

  • 1篇隐马尔可夫模...
  • 1篇语音
  • 1篇语音识别
  • 1篇马尔可夫
  • 1篇马尔可夫模型
  • 1篇混响

机构

  • 1篇西北工业大学

作者

  • 1篇曾向阳
  • 1篇王强
  • 1篇万书婷

传媒

  • 1篇电声技术

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
混响环境中的视-听语音识别被引量:3
2012年
针对混响环境中语音识别率相对安静环境下急剧下降的问题,提出了一种将语音视觉信息与音频特征相结合的方法。通过快速检测和定位包含说话人唇部的感兴趣区域(ROI),获得ROI图像序列。首先对ROI图像进行离散余弦变换,提取反映说话人唇动的视觉特征。音频特征的提取,则采用较为成熟的Mel频率倒谱系数(MF-CC)方法。对所获取的视、音特征采用隐马尔可夫模型作为训练识别算法。测试实验结果证明,采用视、听特征相结合的方法,有效地提高了混响环境中的语音识别率。
万书婷曾向阳王强
关键词:语音识别混响隐马尔可夫模型
共1页<1>
聚类工具0