颜永红
- 作品数:407 被引量:644H指数:13
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
- 相关领域:电子电信自动化与计算机技术理学语言文字更多>>
- 一种目标语音信号的干扰信号生成方法及装置
- 本申请公开了一种目标语音信号的干扰信号生成方法及装置,方法包括:获取待干扰的目标语音信号;对目标语音信号进行分帧处理,获得至少一个语音帧;对其中的每个语音帧进行处理,包括对其进行第一处理、第二处理和/或第三处理,获得频域...
- 李军锋程龙彪姚鼎鼎顾建军颜永红
- 一种基于深度学习的多声源测向方法及系统
- 本发明涉及一种基于深度学习的多声源测向方法及系统,所述方法包括:将阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换,得到傅里叶变换后的信号;将傅里叶变换后的信号输入深度神经网络,使用反向传播方法训...
- 徐及黄兆琼颜永红
- 一种基于深度学习的双耳语音增强方法
- 本发明公开了一种基于深度学习的双耳语音增强方法,包括:对包含待增强目标语音信号的左/右通道带噪语音信号分别进行处理得到左/右频域信号,并对其幅值进行组合得到单通道复数特征,利用左/右通道的频域信号和对应的目标频域信号理论...
- 李军锋孙兴伟夏日升颜永红
- 文献传递
- 基于频率调制信息的人工耳蜗语音处理算法研究被引量:4
- 2009年
- 在传统人工耳蜗连续交叠采样(Continuous Interleaved Sampler,CIS)算法的基础上,提出一种基于精细结构(频率调制信息)的人工耳蜗语音处理算法,在不引入过高频率成分、保证工艺可实现性的前提下,使语音识别率大幅提高。听觉仿真实验的结果表明,与传统的基于时域包络的CIS算法相比,基于精细结构的CIS算法对于元音可懂度的改进可以达到28%;声调的识别率在各种噪声条件下提高20%以上;在一般噪声环境下,辅音和句子的可懂度也分别获得了22.9%和28.3%的改进。
- 杨琳张建平王迪颜永红
- 关键词:人工耳蜗语音处理噪声环境
- 采用性别相关的深度神经网络及非负矩阵分解模型用于单通道语音增强被引量:13
- 2019年
- 为了从带噪信号中得到纯净的语音信号,提出了一种采用性别相关模型的单通道语音增强算法。具体而言,在训练阶段,分别训练了与性别相关的深度神经网络-非负矩阵分解模型用于估计非负矩阵分解中的权重参数;在测试阶段,提出了一种基于非负矩阵分解和组稀疏惩罚的算法用于判断测试语音中说话人的性别信息,然后再采用对应的模型估计权重,并结合已训练好的字典进行语音增强。实验结果表明所提算法在噪声抑制量及语音质量上,均优于一些基于非负矩阵分解的算法和基于深度神经网络的算法。
- 李煦王子腾王晓飞王晓飞付强
- 关键词:语音增强NMF非负矩阵DNN幅度谱
- 基于子带能量的自适应端点检测
- 端点检测(Endpoint Detection)是语音识别系统的重要组成部分。它的作用是在输入信号中寻找语音的起止点,以提高语音识别的速度和准确率。本文提出一种基于子带能量的自适应端点检测算法。该算法通过统计噪声特征,把...
- 国雁萌潘接林颜永红韩疆张建平
- 文献传递
- 统计中文口语理解执行策略的研究被引量:4
- 2017年
- 口语理解的语义框架包括两个决策——关键语义概念识别和意图识别,主要针对这两个决策的执行策略进行研究。首先研究了并联型和级联型两种策略;然后在此基础上提出了联合型结构进行中文口语理解,即通过三角链条件随机场对意图以及关键语义概念共同建模,用一个单独的图模型结构共同表示它们的依赖关系。通过与其他几种策略进行比较实验得出结论:该模型可以将两个任务一次完成,在关键语义概念识别任务上性能优于其他的执行策略。
- 李艳玲颜永红
- 关键词:意图识别
- 基于非监督学习的噪声谱估计与语音活动度检测方法
- 本发明涉及一种基于非监督学习的噪声功率谱估计与语音活动度检测方法,包括下列步骤:1)对于语音信号在每一个频点上的对数幅度特征,建立一个GMM模型;2)对于一段语音数据,设定M帧缓存,把前M帧输入信号存入缓存中,提取缓存中...
- 应冬文颜永红付强潘接林
- 文献传递
- 基于语支鉴别性的音素相关语种识别方法被引量:1
- 2014年
- 提出一种音素相关特征,并将语言学中语支的思想引入语种识别。结合音素相关特征和因子分析方法,提出音素层语支变化量(PLBV)方法。通过对音素后验概率进行降维和均值方差规整,得到音素相关特征。使用因子分析技术将各语支变化量空间的低维变化量因子进行拼接得到音素层语支变化量因子,然后在语支内部和语支间分别对语支变化量因子进行支持向量机(SVM)建模。实验基于俄语音子识别器,在美国国家标准技术署(NIST)2011年语种识别评测(LRE)30s数据集上的实验表明,提出的方法与传统的ivector系统相比,在EER、minDCF和NIST2011年LRE评价指标上相对提升29.9%-54.6%。
- 王宪亮万玉龙杨琳周若华颜永红
- 韵律特征在概率线性判别分析说话人确认中的应用被引量:6
- 2015年
- 研究韵律特征在说话人确认中的应用。将整个韵律轨迹以固定段长和段移进行片段划分,并对其进行勒让德多项式拟合从而获取连续性的韵律特征,将特征映射到总变化因子空间,并用概率线性判别分析来补偿说话人和场景的差异。在美国国家标准技术研究院2010年说话人识别评测扩展核心测试集5的基础上加入噪声构造测试集,并分别对韵律特征和传统Mel频率倒谱系数进行测试。结果显示,随着信噪比的逐渐减小,Mel频率倒谱系数性能出现大幅度下降,而韵律特征性能相对比较稳定,两种特征融合后能使系统性能得到进一步提升,等错率和最小检测错误代价相对于Mel频率倒谱系数单系统最多能分别下降9%和11%。实验表明,韵律特征应用于说话人识别中具有较强的噪声鲁棒性,且与传统的Mel频率倒谱系数存在较强的互补性。
- 梁春燕杨琳周若华颜永红
- 关键词:线性判别分析说话人确认韵律特征MEL频率倒谱系数说话人识别