公共文化服务平台

2024年12月21日星期六

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

万书婷: 作品数：1 被引量：3H指数：1; 供职机构：西北工业大学更多>>; 发文基金：西北工业大学研究生创业种子基金陕西省自然科学基金更多>>; 相关领域：电子电信更多>>

合作作者

王强西北工业大学
曾向阳西北工业大学

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

1篇中文期刊文章

领域

1篇电子电信

主题

1篇隐马尔可夫模...
1篇语音
1篇语音识别
1篇马尔可夫
1篇马尔可夫模型
1篇混响

机构

1篇西北工业大学

作者

1篇曾向阳
1篇王强
1篇万书婷

传媒

1篇电声技术

年份

1篇2012

共 1 条记录，以下是 1-1

全选清除导出

排序方式：

混响环境中的视-听语音识别被引量：3: 2012年; 针对混响环境中语音识别率相对安静环境下急剧下降的问题,提出了一种将语音视觉信息与音频特征相结合的方法。通过快速检测和定位包含说话人唇部的感兴趣区域(ROI),获得ROI图像序列。首先对ROI图像进行离散余弦变换,提取反映说话人唇动的视觉特征。音频特征的提取,则采用较为成熟的Mel频率倒谱系数(MF-CC)方法。对所获取的视、音特征采用隐马尔可夫模型作为训练识别算法。测试实验结果证明,采用视、听特征相结合的方法,有效地提高了混响环境中的语音识别率。; 万书婷曾向阳王强; 关键词：语音识别混响隐马尔可夫模型

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张