公共文化服务平台

2024年12月14日星期六

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

康健: 作品数：2 被引量：23H指数：2; 供职机构：清华大学电子工程系更多>>; 发文基金：国家自然科学基金更多>>; 相关领域：自动化与计算机技术电子电信更多>>

合作作者

刘加清华大学电子工程系
黄光许中国科学院电子学研究所
夏善红中国科学院电子学研究所
田垚清华大学电子工程系
张乔清华大学信息科学技术学院电子工...

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇中文期刊文章

领域

1篇电子电信
1篇自动化与计算...

主题

2篇语音
1篇递归神经
1篇递归神经网络
1篇语音识别
1篇语音识别系统
1篇语音增强
1篇语音增强算法
1篇身份认证
1篇神经网
1篇神经网络
1篇矢量
1篇听觉场景分析
1篇计算听觉场景...

机构

2篇清华大学
1篇中国科学院电...
1篇马凯特大学
1篇中国科学院大...

作者

2篇刘加
2篇康健
1篇何亮
1篇田垚
1篇张卫强
1篇夏善红
1篇黄光许
1篇郭璁
1篇张乔

传媒

1篇计算机应用研...
1篇天津大学学报...

年份

1篇2017
1篇2015

共 2 条记录，以下是 1-2

全选清除导出

排序方式：

低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统被引量：21: 2017年; 在低资源条件下,由于带标注训练数据较少,搭建的语音识别系统性能往往不甚理想。针对此问题,首先在声学模型上研究了长短时记忆(LSTM)递归神经网络,通过对长序列进行建模来充分挖掘上下文信息,并且引入线性投影层减小模型参数;然后研究了在特征空间中对说话人进行建模的技术,提取出能有效反映说话人和信道信息的身份认证矢量(i-vector);最后将上述研究结合构建了基于i-vector特征的LSTM递归神经网络系统。在Open KWS 2013标准数据集上进行实验,结果表明该技术相比于深度神经网络基线系统有相对10%的字节错误率降低。; 黄光许田垚康健刘加夏善红; 关键词：语音识别

一种基于计算听觉场景分析的语音增强算法被引量：2: 2015年; 选取ETSI语音增强系统作为研究对象.该系统使用传统维纳滤波方法,在信噪比较高时降噪性能优秀,但在信噪比较低的情况下,降噪能力弱,对于脉冲噪声无较好抑制.而模拟人耳听觉特性的计算听觉场景分析技术能够比较好地弥补这一缺陷.故在ETSI算法的基础上,结合计算听觉场景分析技术,提出一种新的算法,将维纳滤波器参数估计由原本的Mel域变换到Gammatone域,并进一步利用理想率掩蔽估计对带噪信号进行信噪分离,抑制脉冲噪声.该算法在TIMIT语音库上进行了实验,结果证明,与原算法相比,提出的新算法使听觉质量在低信噪比下提升较大,脉冲噪声抑制亦明显.在低信噪比的情况下,后端语音识别系统的识别率得到提升.; 张卫强郭璁张乔康健何亮刘加Johnson Michael T; 关键词：语音增强计算听觉场景分析

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张