周宁
- 作品数:5 被引量:7H指数:2
- 供职机构:四川大学电子信息学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于过零点双耳时间差的运动声源定位被引量:2
- 2012年
- 人耳听觉定位的一个主要因素是ITD。在传统的计算声场景分析方法中,对ITD的估计采用对双耳神经发放率做互相关求得。但该方法具有计算量大和抗噪声能力弱两大缺陷,给实现运动声源实时定位带来了巨大瓶颈。对较新的过零时间差(ZCTD)方法进行了改进,采用Teager能量算子(TEO)提取语音包络截取可靠语音段估计ITD,避免了ZCTD方法中用信噪比的估值提取可靠ITD的繁琐步骤,能够更快速、准确地估计ITD,具有较强的抗噪声能力。将该方法运用到运动声源定位上,提出了基于过零点双耳时间差的运动声源定位模型,通过仿真实验验证了其实现运动声源实时定位的可行性。
- 李冰夏秀渝申庆超周宁
- 关键词:过零点TEAGER能量算子
- 基于一种改进最短路径法的欠定语音盲分离被引量:3
- 2012年
- 为了在欠定条件下实现语音盲源分离,该文首先利用势函数估计源信号的个数和混叠矩阵,在估计势函数曲线时对其做平滑处理,以提高源信号个数估计的准确性.在语音信号分离部分,提出了一种改进的最短路径法,该方法对混叠信号各时频单元进行分类处理,避免了最短路径法中对每个时频单元进行矩阵求逆运算,在大大减少计算量的同时也降低了分离信号的背景噪声.最后给出了仿真实验,实验结果证明了该算法的可行性和优异性.
- 周宁夏秀渝申庆超李冰
- 关键词:欠定盲分离势函数
- 一种基于衰减-时延聚类估计的欠定语音盲分离算法被引量:2
- 2013年
- 针对衰减-时延混合模型,提出一种改进的欠定语音盲分离算法.第一步根据独立语音源在时频域上的稀疏性,用势函数法分别聚类估计衰减矩阵和时延矩阵,然后配对以确定各声源混合矩阵.第二步由估计的混合矩阵,采用改进最短路径法恢复出目标语音.为了减少计算量,设置门限对能量较小的时频点直接置零处理,在衰减矩阵和时延矩阵聚类估计时采用了分段聚类算法.仿真实验表明本文算法分离出的语音和源语音相似系数达0.96,0.97,0.93,信噪比达12.66dB,12.86dB,8.87dB,且有效减少了计算量,证明了该算法的可行性和有效性.
- 陈林夏秀渝代勇周宁
- 关键词:稀疏性势函数欠定盲分离
- 基于起始和截止时刻的听觉分段
- 2011年
- 分段是计算声场景分析中的一个重要步骤。传统分段是基于响应能量和相邻通道的互相关性,易受干扰,会忽略清音,且计算量大。研究了另一种分段方式:基于语音的起始截止时刻分段。采用一种可纠正失真的包络求取算法获得较准确的信号包络,然后通过卷积高斯函数和低通滤波器进行频域时域平滑处理,并提出一种简单实用的去除系统延迟的方法,最后检测起始截止时刻并将其组合成段。仿真实验表明此分段方法能准确提取起止时刻,完成强噪声环境下语音信号的分段。
- 申庆超夏秀渝李冰周宁
- 适用于边缘设备的轻量级人体检测算法
- 2024年
- 针对现存的人体检测网络都比较复杂,部署到边缘设备上时表现不佳的问题,基于YOLOv7提出一种轻量级人体检测算法。该算法首先使用改进后的ShuffleNev2基本模块替换原网络ELAN模块;接着在主干网络末端添加SE注意力和SPPF池化;然后在Neck部分使用改进后的GSConv替换标准卷积,引入基于GSConv的VoVGSCSP替换ELAN-W模块。通过在GPU和Sophon SE5上的验证结果表明,该轻量级人体检测算法与YOLOv7相比损失2.6%的精度,但计算量大幅度降低,在Sophon SE5上推理速度达到了54 FPS,相比较YOLOv7提升了39 FPS。
- 周宁陶青川彭勃兴
- 关键词:目标检测