张大威
- 作品数:2 被引量:18H指数:1
- 供职机构:北京工业大学电子信息与控制工程学院更多>>
- 发文基金:国家自然科学基金北京市教育委员会科技发展计划北京市自然科学基金更多>>
- 相关领域:电子电信更多>>
- 复杂环境下的近场声源定位技术研究
- 基于麦克风阵列的声源定位和语音增强技术是目前语音信号处理领域的研究热点之一。在视频会议系统,语音识别系统和助听装置等方面,可以通过麦克风阵列声源定位方法来确定说话人的位置。但环境噪声和房间混响的存在将会严重影响现有声源定...
- 张大威
- 关键词:麦克风阵列时延估计复杂环境
- 复杂环境下基于时延估计的声源定位技术研究被引量:18
- 2014年
- 为了改善在复杂环境下声源定位算法的性能,提出了一种新的时延估计(TDE)方法,即基于传递函数比的统计模型方法(ATFR-SM)。该方法采用统计模型去除噪声对传递函数(ATF)的影响,在计算传递函数时对功率谱密度(PSD)进行平滑和"白化",以去除混响对传递函数的影响。同时,算法中引入话音激活检测(VAD)去除对求取传递函数无用的噪声段,以提高时延估计的准确性。此外,将所提时延估计方法与线性定位法相结合,构成一套完整的声源定位方法。实验结果表明,在复杂环境下,时延估计方法具有更低的异常点百分比(PAP)和均方根误差(RMSE),且明显优于传统的参考算法,同时声源定位方法具有更高的定位精度。
- 张大威鲍长春夏丙寅
- 关键词:时延估计VAD统计模型声源定位