国家自然科学基金(61371193)
- 作品数:54 被引量:213H指数:9
- 相关作者:张雪英孙颖畅江张卫黄丽霞更多>>
- 相关机构:太原理工大学山西省人民医院山西水利职业技术学院更多>>
- 发文基金:国家自然科学基金山西省青年科技研究基金山西省回国留学人员科研经费资助项目更多>>
- 相关领域:电子电信自动化与计算机技术生物学医药卫生更多>>
- 信噪比信息与时频特征修正相位的语音增强被引量:5
- 2019年
- 针对在基于谐波模型的相位谱语音增强算法中,只对浊音段相位进行重构导致语音失真和听觉不连贯的问题,提出了用信噪比信息与时频特征改进相位重构的新方法。首先,引入与相位失真有关的时频特征并计算决策阈值;然后利用信噪比信息计算带噪语音与纯净语音的相位偏差,两项比较进一步估计清音段与浊音段的语音相位,能有效改善语音的连贯性;最后将重构的相位与改进二元假设模型的幅值估计结合并进行语音增强。经过对不同噪声背景下的不同语音进行实验表明:新算法的相位差更接近于原信号。与对比算法相比,增强语音的信噪比平均提高2.39dB,语音感知评价指标平均提高0.12,有效地降低了语音失真,提高了语音可懂度。
- 贾海蓉王卫梅吉慧芳
- 关键词:相位重构
- 区分性联合稀疏字典交替优化的语音增强被引量:5
- 2019年
- 在联合稀疏字典的语音增强中,由于联合字典的相似性,导致稀疏重构阶段产生语音和噪声混淆进而产生语音失真问题。针对此,在训练阶段提出一个费希尔准则下的目标函数。该函数包含了语音和噪声的区分约束项,并用与信号变化相关的平衡因子去调整各项权值,为尽可能减小混淆误差提供了保障;同时,为了能使目标函数收敛,设计了一种交替优化字典和稀疏系数的算法,迭代寻找所需的字典和稀疏系数,完成语音字典和噪声字典的输出,得到具有非相似即区分性能较好的联合字典。在增强阶段,将带噪语音信号在联合字典上进行稀疏表示,并估计出语音幅度谱和噪声幅度谱。最后,结合维纳滤波器和理想二值掩模的优点,提出了新的软掩模滤波器,进一步消除了残余噪声。通过对不同信噪比的带噪语音进行实验,新算法得到的语音信噪比和听觉感知评价都较高,验证了新算法在提高语音性能方面的有效性。
- 贾海蓉王卫梅王雁裴俊华
- 关键词:语音增强费希尔
- 基于子空间域的自适应小字典的语音增强被引量:1
- 2019年
- 针对传统小字典的语音增强算法在消除噪声时导致语音失真的问题,提出一种子空间域的自适应小字典的语音增强算法。首先,在子空间域中利用带噪语音信号的特征值构造过完备的小字典,使得该字典对信号失真和残留噪声具有很好的调控机制,即在消除噪声的同时为保证信号失真尽可能的小提供了可能;其次,通过过完备的小字典对带噪语音的特征值用K奇异值分解(K-SVD)算法不断进行稀疏表示和字典更新,其中在正交匹配追踪(OMP)算法中设置相关性阈值与能量阈值来自适应控制重构阶段及迭代次数,减少重构时间。在不同的噪声背景下的实验结果表明,与文献算法相比,新算法的增强语音的SNR和PESQ较高,减少了语音失真,提高了语音质量。
- 裴俊华贾海蓉
- 关键词:语音增强子空间OMP
- 不同语种及非言语情感声音的ERP研究
- 采用事件相关电位(ERP)技术研究人脑对声音的运行机制是一种有效的方法。本文主要侧重两个方面研究:一是从语言种类出发,研究语义理解程度在情感语音中是否存在显著性;二是从言语和非言语角度出发,研究言语是否对情感声音存在影响...
- 畅江张雪英张奇萍陈宏涛孙颖胡凤云
- 关键词:情感语音
- 文献传递
- 相空间重构的情感语音特征提取及优化被引量:9
- 2017年
- 针对现有语音情感特征在表征情感信息上的不完整,将相空间重构理论引入到情感语音的特征提取中.通过分析不同语音情感状态下相空间重构的几何特性,提取了该重构相空间下基于轨迹的描述轮廓的5种非线性几何特征作为新的情感语音特征参数,并根据情感与特征映射的关系提出一种特征参数优化方法.首先,选用德语柏林语音库中的高兴、悲伤、中性和生气4种情感作为实验样本;其次,提取非线性几何特征和非线性属性特征(最小延迟时间、关联维数、Kolmogorov熵、最大Lyapunov指数和Hurst指数);最后,根据设计方案采用支持向量机进行情感语音识别.实验结果表明,该特征相较于非线性属性特征在情感语音识别上有较强的优势度,联合非线性属性特征后,通过特征参数优化的方法获得了最优的非线性特征集合,验证了该方法的实用性.
- 孙颖宋春晓
- 关键词:相空间重构语音情感识别
- 帧间自适应的压缩感知谱减去噪方法
- 2017年
- 针对应用压缩感知理论对含噪语音进行去噪其信噪比低的问题,以及应用谱减法对含噪语音去噪后语音信号仍不清晰的情况,提出帧间自适应的压缩感知谱减去噪方法。同时,由于传统压缩感知理论不能使语音信号在重构时实现帧间自适应的去噪效果,对此缺陷提出一种改进算法,并且将该算法应用到谱减法的去噪过程中。相比于经典的谱减法,实验结果表明,所提算法对含噪语音进行去噪不仅可以提高含噪语音的去噪效果,还可以有效地解决谱减法无法去除背景噪声及音乐噪声的问题。
- 畅江张雪英李凤莲
- 关键词:压缩感知谱减法语音去噪
- 基于DBM-LSTM的多特征语音情感识别被引量:9
- 2020年
- 为增强不同情感特征的融合程度和语音情感识别模型的鲁棒性,提出一种神经网络结构DBM-LSTM用于语音情感识别。利用深度受限玻尔兹曼机的特征重构原理将不同的情感特征进行融合;利用长短时记忆单元对短时特征进行长时建模,增强语音情感识别模型的鲁棒性;在柏林情感语音数据库上进行分类实验。研究结果表明,与传统识别模型相比,DBM-LSTM网络结构更适用于多特征语音情感识别任务,最优识别结果提升11%。
- 高帆张雪英黄丽霞李宝芸
- 关键词:语音情感识别
- 小波变换结合盲源分离的EEG情感识别被引量:1
- 2018年
- 由于脑电信号独立源数目的不确定性以及其他噪声的干扰,使得采集的脑电信号各导信号之间产生串扰、源信号难以估计以及噪声混杂等问题,严重影响了对脑电信号的分析研究。将小波变换与盲源分离算法相结合,并对盲源分离算法中维格纳分布存在的交叉项干扰现象进行重排处理。主要思路是首先将每一导信号进行小波变换,提取出特征波β波,然后对这些β波信号进行基于重排光滑伪维格纳分布的盲源分离,分离出关联性极大的β波成分。实验结果表明,所用方法分离出了各导信号中关联性大的脑电信号成分,并在一定程度上解决了源信号难以估计等问题,使识别结果有明显的提升。
- 沈成业张雪英孙颖畅江
- 关键词:小波变换盲源分离
- 融合平滑滤波器和子带分析的双声源定位被引量:3
- 2018年
- 为改善混响环境下多声源定位算法的性能,提出了一种基于子带分析的平滑广义互相关多声源定位算法。该算法利用语音信号在频域的稀疏性,首先对麦克风阵列接收到的混合语音信号进行子带划分,计算每个子带中信号的平滑广义互相关函数,再通过加权平均方式融合各子带的时延信息,最后结合空间几何定位算法获得各个声源的三维位置。在互相关原理的基础上,采用一阶平滑滤波器对互功率谱函数进行多帧加权平滑处理,减小仅由当前帧估计结果带来的波动,保持各帧之间的连续性,提高算法的定位性能。仿真结果表明:本文提出的算法在混响环境下获得了较高的定位精度,且明显优于参考算法。
- 黄丽霞昝丹斐张岁岁张雪英
- 关键词:广义互相关平滑滤波器麦克风阵列
- 基于主辅网络特征融合的语音情感识别被引量:7
- 2021年
- 为了有效特征提取与融合提高语音情感识别率,提出了一种使用主辅网络进行深度特征融合的语音情感识别算法。首先将段特征输入BLSTM-Attention网络作为主网络,其中注意力机制能够关注语音信号中的情感信息;然后,把Mel语谱图输入CNN-GAP网络作为辅助网络,GAP可以减轻全连接层带来的过拟合;最后,将两个网络提取的深度特征以主辅网络方式进行特征融合,解决不同类型特征直接融合带来的识别结果不理想的问题。在IEMOCAP数据集上对比4种模型的实验结果表明,使用主辅网络深度特征融合的WA和UA均有不同程度的提高。
- 胡德生张雪英张静李宝芸
- 关键词:语音情感识别卷积神经网络