您的位置: 专家智库 > >

北京市教育委员会科技发展计划(KZ201110005005)

作品数:17 被引量:64H指数:5
相关作者:鲍长春夏丙寅何玉文周璇鲍枫更多>>
相关机构:北京工业大学江苏师范大学更多>>
发文基金:北京市教育委员会科技发展计划国家自然科学基金北京市属高等学校人才强教计划资助项目更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 17篇期刊文章
  • 1篇会议论文

领域

  • 15篇电子电信
  • 3篇自动化与计算...

主题

  • 7篇噪声
  • 6篇音频
  • 5篇语音
  • 4篇混合模型
  • 4篇高斯
  • 4篇高斯混合
  • 4篇高斯混合模型
  • 3篇语音增强
  • 3篇噪声估计
  • 3篇统计模型
  • 2篇信号
  • 2篇信念网络
  • 2篇压缩域
  • 2篇音频编码
  • 2篇音频信号
  • 2篇频带
  • 2篇频带扩展
  • 2篇谱熵
  • 2篇网络
  • 2篇宽带

机构

  • 18篇北京工业大学
  • 3篇江苏师范大学

作者

  • 17篇鲍长春
  • 8篇夏丙寅
  • 3篇何玉文
  • 3篇邓峰
  • 3篇马勇
  • 3篇周璇
  • 3篇鲍枫
  • 2篇芮瑞
  • 2篇刘鑫
  • 2篇梁岩
  • 1篇陈浩
  • 1篇李娜
  • 1篇张大威
  • 1篇张兴涛
  • 1篇张丽燕
  • 1篇李红蕊
  • 1篇李晓明

传媒

  • 6篇信号处理
  • 4篇通信学报
  • 4篇电子学报
  • 1篇清华大学学报...
  • 1篇数据采集与处...
  • 1篇计算机工程与...

年份

  • 5篇2014
  • 9篇2013
  • 2篇2012
  • 2篇2011
17 条 记 录,以下是 1-10
排序方式:
基于高斯混合模型的压缩域语音增强方法被引量:9
2012年
为了有效利用纯净语音导抗谱频率参数(ISFs)的先验知识,本文针对ITU-T G.722.2宽带语音编码标准提出了一种基于高斯混合模型的压缩域语音增强方法.首先,将含噪语音、纯净语音的导抗谱频率参数,以及对应的增益调整因子构成特征矢量,并利用高斯混合模型拟合其概率密度;然后,在最小均方误差(MMSE)准则下对纯净语音的特征参数进行最优贝叶斯估计.为了兼容编码器中的非连续性传输模式,当处理信号为非语音信息时,算法在保持噪声帧谱包络参数不变的前提下,按固定比例调整对数帧能量;且若出现帧擦除情况,算法不调整接收到的码流,并按正常帧处理方式调整恢复后的参数以更新相关历史.本文采用ITU-T G.160标准进行了性能测试,结果表明,与参考方法相比,所提方法在保证信噪比提高能力的同时,可以达到更大的噪声衰减量,且增强语音的客观质量更优.
梁岩鲍长春夏丙寅何玉文周璇李娜
关键词:语音增强参数域高斯混合模型贝叶斯估计
采用经验模态分解的语音与音频通用编码方法
2013年
为有效解决现有单一模型编码器无法在中低速率对语音和音频信号进行高质量通用编码的问题,本文借助语音与音频信号的谐波特性,建立了一种对语音和音频信号统一编码的方法。首先,本文利用经验模态分解(Empirical Mode Decomposition,EMD)提取输入信号的谐波成分;其次,利用感知匹配追踪算法,并结合正弦参数建模对谐波成分进行参数提取与量化;第三,对于量化谐波后的残差进行抖动格型矢量量化,以提升重建音频的主观听觉质量,并最终实现一套包含24kbps和32kbps码率的宽带语音与音频通用编码器;最后,对所提算法进行了客观PESQ/PEAQ和主观A/B测试,并与ITU-T G.722.1和G.722.2编码器进行了比较,实验结果表明,所提编码器对语音和音频信号的编码质量均优于参考编码器。
李晓明鲍长春
关键词:语音编码音频编码经验模态分解
适应噪声强度突变的噪声估计加速方法被引量:3
2013年
为提高传统噪声估计方法对噪声强度突变的跟踪能力,本文在最小值控制递归平均(MCRA)方法基础上提出了噪声估计加速方法。该方法首先检测功率谱的突变,在检测到突变后设定具有自适应长度的拖尾段,并在拖尾段中利用对数似然比、谱熵和平均幅度差函数进行话音活动性检测(VAD),而后结合噪声估计与功率谱最小值比例等辅助参数判定是否对噪声估计进行强制更新。ITU-T G.160测试结果表明,噪声估计加速算法的引入未对噪声强度平稳情况下的语音增强算法性能产生影响,但显著降低了噪声强度突变时的收敛时间,并在很大程度上抑制了噪声估计收敛段中的音乐噪声。
夏丙寅鲍长春
关键词:语音增强噪声估计谱熵对数似然比
一种基于自适应噪声估计的宽带语音增强算法被引量:1
2011年
为解决传统算法对噪声适应性较差,残留音乐噪声较强的问题,本文提出了一种基于自适应噪声估计的宽带语音增强算法。该算法可应用于宽带语音编码器,以提升在噪声环境下的编码质量。本文所提算法利用谱熵对噪声类型进行有效地判别,将背景噪声分为白噪声和有色噪声两类,并根据噪声特性选择适当的噪声估计方法。在白噪声背景下,选择一种谱平滑的方法;在有色噪声背景下,则选择经典的最小值控制递归平均算法。在此基础上结合经典的统计模型方法,构建一种具有较强噪声鲁棒性的宽带语音增强算法。在ITU-T G.160标准下对算法进行性能测试,测试结果表明,在不同强度的背景噪声环境下,增强语音的信噪比提高都较为明显。同时,在低信噪比情况下,该算法有效地抑制了严重影响听觉质量的音乐噪声现象。
周璇鲍长春夏丙寅梁岩何玉文
关键词:噪声估计统计模型谱熵
双麦克风噪声消除的高斯混合模型法被引量:1
2014年
为了解决基于相位差滤波器(PBF)双麦克风方法残留噪声较多的问题,本文在PBF方法基础上提出一种基于高斯混合模型的双麦克风噪声消除方法。该方法首先采用高斯混合模型(GMM)对目标语音存在(l1)与目标语音不存(l0)在这两种情况进行建模。其次,在实时增强阶段,根据贝叶斯分类器计算每帧的目标语音存在概率(TSPP),随后根据噪声抑制最大化准则修正PBF的增益函数并得到改进的相位差滤波器(IPBF),最后将TSPP与IPBF的增益函数相结合,进而得到一种用于双麦克风噪声消除的掩蔽滤波器。实验结果表明:本文提出算法可有效抑制残留噪声,尤其是在目标语音不存在的时间段。
陈浩鲍长春夏丙寅
关键词:噪声消除相位差高斯混合模型
基于AAC比特流的音频信号Hiss噪声抑制方法
2013年
基于AAC比特流,提出了一种压缩域音频Hiss噪声抑制方法。该方法的输入为含噪音频的AAC比特流,输出为增强音频的AAC比特流。首先,利用修正的绝对中值标准差(MMAD,modified median absolute deviation)估计Hiss噪声,其次,利用修正的离散傅里叶变换(MDFT,modified discrete Fourier transform)计算听觉掩蔽阈值参数,最后,根据参数软阈值方法得到增强的AAC比特流,并用于AAC解码器得到最终的增强音频信号。主观和客观测试结果表明,所提出的方法能有效去除AAC解码音频信号中的Hiss噪声,其性能明显优于现有的几种Hiss噪声消除方法。
邓峰鲍长春鲍枫
关键词:压缩域噪声抑制
基于辨别性深度信念网络的说话人分割
本文在语音信号的超矢量特征空间,提出了一种基于Fisher准则的可辨别性深度信念网络(DDBN)训练方法,得到了优于传统深度信念网络(DBN)的说话人码本矢量特征,并利用这些码本特征对多说话人的音段进行了聚类与分割。由T...
马勇鲍长春夏丙寅
关键词:FISHER准则
基于MPEG-AAC编码器的压缩域音频增强方法被引量:1
2014年
本文基于MPEG-AAC音频编解码器,提出了一种压缩域的音频增强方法.首先,对含噪音频信号的比特流进行解码,得到含噪音频信号的MDCT系数;然后,利用修正的加权递归平均(Modified Weighted Recursive Averaging,MWRA)方法估计噪声功率;再者,利用基于听觉掩蔽原理的自适应β-阶双曲余弦(COSH)统计模型,对含噪音频的MDCT系数进行增强处理;最后,将增强后的MDCT系数重新量化编码,得到用于解码的增强比特流实验结果表明,本文提出的方法能有效去除AAC解码音频信号中的多种背景噪声,其性能明显优于参考方法.
邓峰鲍枫鲍长春
关键词:压缩域
噪声环境下的窄带音频信号快速分类方法被引量:1
2011年
提出了一种基于线性判别分析和高斯混合模型的窄带音频快速分类方法,该方法在白噪声、街道噪声和车内噪声环境下都能有效区分语音、音乐和噪声。实验结果表明,该方法在保证分类时间不大于1s的情况下,分类准确率能达到95以上。
芮瑞鲍长春
关键词:特征提取线性判别分析高斯混合模型
基于分形的音频频带盲扩展方法被引量:2
2013年
本文提出了一种基于分形理论的音频频带盲扩展方法。首先,借助重标极差分析法估计频谱细节序列的Hurst指数,对不同音频信号谱细节序列的Hurst指数进行统计分析,验证了音频信号频域序列具有长相关特性。然后,运用坐标延迟法对谱细节序列进行相空间重构,基于夹角余弦选取预测中心相点的近邻点,根据预测中心相点和近邻相点的相关性,求取一个吸引子与预测中心相点相近的迭代函数系统,实现对高频谱细节的分形预测。最后,结合高斯混合模型的高频能量估计算法,实现宽带向超宽带的扩展算法。主、客观质量评测均表明本文算法优于传统的频带盲扩展方法。
李红蕊鲍长春刘鑫白海钏
关键词:频带扩展相空间分形HURST指数
共2页<12>
聚类工具0