国家教育部博士点基金(20111402110013)
- 作品数:4 被引量:15H指数:2
- 相关作者:张雪英马建芬孟欣曹棣付建梅更多>>
- 相关机构:太原理工大学更多>>
- 发文基金:国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 提取耳蜗熵的语音可懂度评价算法被引量:1
- 2013年
- 为了提高主观和客观听力条件下语音可懂度的相关度,提出用耳蜗熵值来衡量语音的可懂度。利用提取的耳蜗熵值分段后的语音作为归一化协方差(normalized covariance measure,NCM)的语音可懂度算法的输入,分析高熵值语音段和低熵值语音段主客观相关系数的高低。结果表明,提取的高耳蜗熵值语音段比低熵值语音段对语音可懂度算法与主观评价的相关性高,高熵值语音段携带有更多的语音信息。
- 付建梅张雪英曹棣马建芬
- 关键词:语音增强语音可懂度
- 改进的参数自适应的维纳滤波语音增强算法被引量:8
- 2017年
- 为探究不同的噪声对语音增强算法性能的不同影响,提出一种参数自适应维纳滤波语音增强算法,根据不同的噪声类型,设置不同的参数初始值,做不同的噪声功率谱评估。使用深度神经网络对噪声进行分类,得到准确的分类结果;对不同的噪声,得到维纳滤波算法与使用声音活动检测(VAD)进行噪声功率谱评估相结合的语音增强算法的最优系数组合。进行系列实验,客观的评价结果表明,该算法在Babble噪声下,5db的信噪比时,能够将PESQ值提高0.25,针对其它的噪声与不同信噪比情况,PESQ值也有相应的提高。
- 孟欣马建芬张雪英
- 关键词:语音增强
- 基于语音起始段检测语音可懂度客观评价方法被引量:1
- 2015年
- 传统的语音评价算法,如SNR,存在语音的可懂度相关性不高的问题。有研究表明,语音的不同部分对可懂度的贡献不同,语音的浊音起始段对可懂度的影响较大。提出一种可懂度相关性相对较高的语音评价算法。在计算分段SNR之前,对语音段进行选择,选出起始段。所提出方法的可懂度计算结果与主观得分进行比较,实验结果表明,结合语音起始段(speech onset)检测算法,能够将可懂度与主观评价的相关值分别提高0.11(辅音)和0.06(句子),这也从一个侧面验证了语音的起始段对可懂度有较大影响这一研究结论。
- 徐宇卓马建芬张雪英
- 关键词:语音可懂度相关系数
- 基于噪声特性的语音增强算法被引量:5
- 2016年
- 针对不同的语音增强算法对不同噪声的增强效果不同,提出了一种基于深度神经网络的噪声分类的语音增强算法。首先,使用深度神经网络(DNN)算法对噪声进行分类。分类算法包括训练阶段和分类阶段。在训练阶段,采用babble,car,street,train四中噪声对DNN进行训练;在分类阶段,将提取的噪声输入训练好的DNN中,得到分类结果,并对分类性能进行评估。其次,采用PESQ,LSD及SNR等语音评估方法,对不同的含噪语音在不同信噪比、不同语音增强算法下进行评估。语音增强算法包括子空间法、维纳滤波算法、谱减法及对数最小均方误差法(log MMSE),噪声包括babble,car,street,train,信噪比为-5db,0db和5db,并对通过评估得到的值采用平均值法得到噪声和语音增强算法的最佳匹配;最后,针对不同分类噪声,采用不同的增强算法进行语音增强,并对4种噪声之外的噪声根据本文算法选取相应的语音增强算法。
- 孟欣马建芬张雪英曹棣
- 关键词:语音增强子空间法维纳滤波谱减法