您的位置: 专家智库 > >

颜永红

作品数:394 被引量:608H指数:12
供职机构:中国科学院声学研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
相关领域:电子电信自动化与计算机技术理学语言文字更多>>

文献类型

  • 174篇专利
  • 139篇期刊文章
  • 71篇会议论文
  • 8篇科技成果

领域

  • 175篇电子电信
  • 76篇自动化与计算...
  • 17篇理学
  • 14篇语言文字
  • 9篇文化科学
  • 6篇一般工业技术
  • 4篇医药卫生
  • 3篇艺术
  • 2篇交通运输工程

主题

  • 195篇语音
  • 79篇语音识别
  • 45篇信号
  • 43篇神经网
  • 43篇神经网络
  • 33篇音频
  • 29篇网络
  • 28篇声学模型
  • 27篇阵列
  • 26篇语音增强
  • 23篇语音信号
  • 21篇音素
  • 20篇噪声
  • 17篇解码
  • 15篇语言模型
  • 15篇声学特征
  • 15篇自适应
  • 15篇混响
  • 14篇语音增强方法
  • 13篇声源

机构

  • 392篇中国科学院
  • 42篇北京中科信利...
  • 32篇中国科学院新...
  • 32篇中国科学院大...
  • 9篇北京理工大学
  • 8篇国家计算机网...
  • 6篇国家互联网应...
  • 4篇河北师范大学
  • 4篇内蒙古师范大...
  • 4篇江西理工大学
  • 2篇国际关系学院
  • 2篇北京交通大学
  • 2篇西安电子科技...
  • 2篇北京大学口腔...
  • 1篇贵州大学
  • 1篇大连理工大学
  • 1篇南京邮电大学
  • 1篇山东大学
  • 1篇山东理工大学
  • 1篇昆明理工大学

作者

  • 392篇颜永红
  • 69篇张鹏远
  • 54篇李军锋
  • 54篇潘接林
  • 41篇付强
  • 32篇赵庆卫
  • 26篇国雁萌
  • 20篇董滨
  • 19篇应冬文
  • 15篇张晴晴
  • 15篇夏日升
  • 15篇潘复平
  • 15篇周若华
  • 13篇葛凤培
  • 13篇李明
  • 12篇韩疆
  • 12篇张建平
  • 10篇杨琳
  • 10篇王晓飞
  • 9篇吕萍

传媒

  • 35篇声学学报
  • 19篇网络新媒体技...
  • 10篇电子与信息学...
  • 8篇清华大学学报...
  • 7篇微计算机应用
  • 7篇中国科学院声...
  • 6篇应用声学
  • 6篇重庆邮电大学...
  • 5篇声学技术
  • 5篇中国声学学会...
  • 4篇自动化学报
  • 4篇第八届全国人...
  • 4篇第十四届全国...
  • 3篇计算机应用
  • 3篇计算机科学
  • 3篇中国科学:信...
  • 3篇中国科学院声...
  • 2篇物理学报
  • 2篇通信学报
  • 2篇数据采集与处...

年份

  • 2篇2024
  • 15篇2023
  • 25篇2022
  • 32篇2021
  • 21篇2020
  • 21篇2019
  • 21篇2018
  • 26篇2017
  • 10篇2016
  • 25篇2015
  • 28篇2014
  • 27篇2013
  • 16篇2012
  • 13篇2011
  • 30篇2010
  • 24篇2009
  • 8篇2008
  • 11篇2007
  • 9篇2006
  • 22篇2005
394 条 记 录,以下是 1-10
排序方式:
一种目标语音信号的干扰信号生成方法及装置
本申请公开了一种目标语音信号的干扰信号生成方法及装置,方法包括:获取待干扰的目标语音信号;对目标语音信号进行分帧处理,获得至少一个语音帧;对其中的每个语音帧进行处理,包括对其进行第一处理、第二处理和/或第三处理,获得频域...
李军锋程龙彪姚鼎鼎顾建军颜永红
一种基于深度学习的双耳语音增强方法
本发明公开了一种基于深度学习的双耳语音增强方法,包括:对包含待增强目标语音信号的左/右通道带噪语音信号分别进行处理得到左/右频域信号,并对其幅值进行组合得到单通道复数特征,利用左/右通道的频域信号和对应的目标频域信号理论...
李军锋孙兴伟夏日升颜永红
文献传递
基于频率调制信息的人工耳蜗语音处理算法研究被引量:4
2009年
在传统人工耳蜗连续交叠采样(Continuous Interleaved Sampler,CIS)算法的基础上,提出一种基于精细结构(频率调制信息)的人工耳蜗语音处理算法,在不引入过高频率成分、保证工艺可实现性的前提下,使语音识别率大幅提高。听觉仿真实验的结果表明,与传统的基于时域包络的CIS算法相比,基于精细结构的CIS算法对于元音可懂度的改进可以达到28%;声调的识别率在各种噪声条件下提高20%以上;在一般噪声环境下,辅音和句子的可懂度也分别获得了22.9%和28.3%的改进。
杨琳张建平王迪颜永红
关键词:人工耳蜗语音处理噪声环境
采用性别相关的深度神经网络及非负矩阵分解模型用于单通道语音增强被引量:11
2019年
为了从带噪信号中得到纯净的语音信号,提出了一种采用性别相关模型的单通道语音增强算法。具体而言,在训练阶段,分别训练了与性别相关的深度神经网络-非负矩阵分解模型用于估计非负矩阵分解中的权重参数;在测试阶段,提出了一种基于非负矩阵分解和组稀疏惩罚的算法用于判断测试语音中说话人的性别信息,然后再采用对应的模型估计权重,并结合已训练好的字典进行语音增强。实验结果表明所提算法在噪声抑制量及语音质量上,均优于一些基于非负矩阵分解的算法和基于深度神经网络的算法。
李煦王子腾王晓飞王晓飞付强
关键词:语音增强NMF非负矩阵DNN幅度谱
基于子带能量的自适应端点检测
端点检测(Endpoint Detection)是语音识别系统的重要组成部分。它的作用是在输入信号中寻找语音的起止点,以提高语音识别的速度和准确率。本文提出一种基于子带能量的自适应端点检测算法。该算法通过统计噪声特征,把...
国雁萌潘接林颜永红韩疆张建平
文献传递
统计中文口语理解执行策略的研究被引量:3
2017年
口语理解的语义框架包括两个决策——关键语义概念识别和意图识别,主要针对这两个决策的执行策略进行研究。首先研究了并联型和级联型两种策略;然后在此基础上提出了联合型结构进行中文口语理解,即通过三角链条件随机场对意图以及关键语义概念共同建模,用一个单独的图模型结构共同表示它们的依赖关系。通过与其他几种策略进行比较实验得出结论:该模型可以将两个任务一次完成,在关键语义概念识别任务上性能优于其他的执行策略。
李艳玲颜永红
关键词:意图识别
基于非监督学习的噪声谱估计与语音活动度检测方法
本发明涉及一种基于非监督学习的噪声功率谱估计与语音活动度检测方法,包括下列步骤:1)对于语音信号在每一个频点上的对数幅度特征,建立一个GMM模型;2)对于一段语音数据,设定M帧缓存,把前M帧输入信号存入缓存中,提取缓存中...
应冬文颜永红付强潘接林
文献传递
基于语支鉴别性的音素相关语种识别方法
2014年
提出一种音素相关特征,并将语言学中语支的思想引入语种识别。结合音素相关特征和因子分析方法,提出音素层语支变化量(PLBV)方法。通过对音素后验概率进行降维和均值方差规整,得到音素相关特征。使用因子分析技术将各语支变化量空间的低维变化量因子进行拼接得到音素层语支变化量因子,然后在语支内部和语支间分别对语支变化量因子进行支持向量机(SVM)建模。实验基于俄语音子识别器,在美国国家标准技术署(NIST)2011年语种识别评测(LRE)30s数据集上的实验表明,提出的方法与传统的ivector系统相比,在EER、minDCF和NIST2011年LRE评价指标上相对提升29.9%-54.6%。
王宪亮万玉龙杨琳周若华颜永红
韵律特征在概率线性判别分析说话人确认中的应用被引量:6
2015年
研究韵律特征在说话人确认中的应用。将整个韵律轨迹以固定段长和段移进行片段划分,并对其进行勒让德多项式拟合从而获取连续性的韵律特征,将特征映射到总变化因子空间,并用概率线性判别分析来补偿说话人和场景的差异。在美国国家标准技术研究院2010年说话人识别评测扩展核心测试集5的基础上加入噪声构造测试集,并分别对韵律特征和传统Mel频率倒谱系数进行测试。结果显示,随着信噪比的逐渐减小,Mel频率倒谱系数性能出现大幅度下降,而韵律特征性能相对比较稳定,两种特征融合后能使系统性能得到进一步提升,等错率和最小检测错误代价相对于Mel频率倒谱系数单系统最多能分别下降9%和11%。实验表明,韵律特征应用于说话人识别中具有较强的噪声鲁棒性,且与传统的Mel频率倒谱系数存在较强的互补性。
梁春燕杨琳周若华颜永红
关键词:线性判别分析说话人确认韵律特征MEL频率倒谱系数说话人识别
一种基于语义先验的选择性注意的多通道语音增强方法
本发明提供了一种基于语义先验的选择性注意的多通道语音增强方法,所述方法包括:多传声器阵列拾取来自于混响环境中的任意方向的语音信号,采集多路语音信号并进行预处理;利用激活词语音识别模型检测预处理后的语音信号中存在的特定激活...
付强王晓飞国雁萌颜永红
文献传递
共40页<12345678910>
聚类工具0