2024年12月21日
星期六
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
万书婷
作品数:
1
被引量:3
H指数:1
供职机构:
西北工业大学
更多>>
发文基金:
西北工业大学研究生创业种子基金
陕西省自然科学基金
更多>>
相关领域:
电子电信
更多>>
合作作者
王强
西北工业大学
曾向阳
西北工业大学
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
电子电信
主题
1篇
隐马尔可夫模...
1篇
语音
1篇
语音识别
1篇
马尔可夫
1篇
马尔可夫模型
1篇
混响
机构
1篇
西北工业大学
作者
1篇
曾向阳
1篇
王强
1篇
万书婷
传媒
1篇
电声技术
年份
1篇
2012
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
混响环境中的视-听语音识别
被引量:3
2012年
针对混响环境中语音识别率相对安静环境下急剧下降的问题,提出了一种将语音视觉信息与音频特征相结合的方法。通过快速检测和定位包含说话人唇部的感兴趣区域(ROI),获得ROI图像序列。首先对ROI图像进行离散余弦变换,提取反映说话人唇动的视觉特征。音频特征的提取,则采用较为成熟的Mel频率倒谱系数(MF-CC)方法。对所获取的视、音特征采用隐马尔可夫模型作为训练识别算法。测试实验结果证明,采用视、听特征相结合的方法,有效地提高了混响环境中的语音识别率。
万书婷
曾向阳
王强
关键词:
语音识别
混响
隐马尔可夫模型
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张