您的位置: 专家智库 > >

国家自然科学基金(91120001)

作品数:17 被引量:33H指数:4
相关作者:颜永红许春冬李军锋应冬文张震更多>>
相关机构:中国科学院北京理工大学江西理工大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
相关领域:电子电信自动化与计算机技术医药卫生更多>>

文献类型

  • 12篇期刊文章
  • 12篇会议论文

领域

  • 21篇电子电信
  • 2篇医药卫生
  • 1篇自动化与计算...

主题

  • 12篇语音
  • 8篇语音识别
  • 4篇神经网
  • 4篇神经网络
  • 4篇DNN
  • 3篇语音增强
  • 2篇序贯
  • 2篇语种
  • 2篇语种识别
  • 2篇随机场
  • 2篇条件随机场
  • 2篇奇异值
  • 2篇奇异值分解
  • 2篇矩阵
  • 2篇矩阵分解
  • 2篇聚类
  • 2篇均值聚类
  • 2篇功率谱
  • 2篇非负矩阵
  • 2篇非负矩阵分解

机构

  • 18篇中国科学院
  • 5篇国家互联网应...
  • 4篇北京理工大学
  • 3篇江西理工大学
  • 2篇北京大学
  • 1篇河北师范大学
  • 1篇上海海洋大学
  • 1篇亚利桑那州立...

作者

  • 11篇颜永红
  • 3篇计哲
  • 3篇张鹏远
  • 3篇付强
  • 3篇李军锋
  • 3篇许春冬
  • 2篇吴超
  • 2篇葛凤培
  • 2篇夏日升
  • 2篇国雁萌
  • 2篇潘接林
  • 2篇应冬文
  • 2篇张震
  • 2篇李煦
  • 1篇姜开宇
  • 1篇张晴晴
  • 1篇陈梦喆
  • 1篇王宪亮
  • 1篇张宇
  • 1篇潘复平

传媒

  • 5篇第十三届全国...
  • 2篇声学学报
  • 2篇清华大学学报...
  • 2篇Chines...
  • 1篇北京大学学报...
  • 1篇计算机应用
  • 1篇计算机应用研...
  • 1篇天津大学学报...
  • 1篇Journa...
  • 1篇Neuros...

年份

  • 2篇2017
  • 1篇2016
  • 7篇2015
  • 4篇2014
  • 10篇2013
17 条 记 录,以下是 1-10
排序方式:
融合词义消歧的汉语句法分析方法研究被引量:2
2015年
将句法分析与词义消歧相结合,根据层次化语义知识的句法分析框架,在句法分析训练过程中,利用句法结构信息对文法模型进行调整,解决了引入语义时所面对的歧义问题,构建一种句法分析和词义消歧的一体化方法。实验表明,在句法分析过程中进行词义消歧处理,使句法分析的性能显著提升,同时也获得词义消歧能力。
李冬晨张献涛樊扬吴玺宏
关键词:句法分析词义消歧一体化
一种小资源下语音识别算法设计与优化
在可穿戴设备和智能家居系统的实际应用中,语音识别引擎需要占用极小的资源并具有较强的拒识能力。传统的语音识别算法无法满足小资源的这种需求,本文在解码策略和拒识算法设计上均提出了改进方法。解码策略方面,通过修改垃圾音素的重入...
张鹏远计哲侯炜金鑫韩卫生
关键词:语音识别置信度
文献传递
基于NMF和FCRF的单通道语音分离被引量:1
2017年
近年来,非负矩阵分解(non-negative matrix factorization,NMF)被广泛应用于单通道语音分离问题。然而,标准的NMF算法假设语音的相邻帧之间是相互独立的,不能表征语音信号的时间连续性信息。为此,该文提出了一种基于NMF和因子条件随机场(factorial conditional random field,FCRF)的语音分离算法,首先将NMF和k均值聚类结合对纯净语音的频谱结构以及时间连续性进行建模,然后利用得到的模型训练FCRF模型,进而对混合语音信号进行分离。结果表明:该算法相比没有考虑语音时间连续特性的基于NMF的算法如激活集牛顿算法(active-set Newton algorithm,ASNA),在客观指标上有明显提高。
李煦屠明吴超国雁萌纳跃跃付强颜永红
关键词:非负矩阵分解K均值聚类
基于PLDA的“一对多”下的说话人确认方法研究
近年来,概率线性鉴别分析(Probabilistic Linear Discriminant Analysis,PLDA)因其优异的性能而得到学者们的广泛关注。然而,各主流单位的PLDA研究都是基于NISTSRE 201...
许云飞黄厚军金怡珠李桂莲周若华
关键词:说话人识别
基于DNN的声学模型自适应实验被引量:5
2015年
声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关的自动语音识别任务,对典型的两种声学模型自适应算法进行了尝试,实验了基于线性变换网络的自适应方法和基于相对熵正则化准则的自适应方法,并对两种算法进行了详尽的系统性能比较.结果表明,在不同的自适应数据量下,相对熵正则化自适应方法均能表现出较好的性能.
张宇计哲万辛张震葛凤培颜永红
关键词:语音识别
两扬声器配置下的串声消除系统参数优化设置被引量:1
2014年
针对三维声音两扬声器重放中基本上独立研究逆滤波器的设计或扬声器的配置等因素对串声消除系统(CCS)性能的影响,提出了采用频域最小均方(LS)估计逼近方法,系统考察这些因素之间的关联以及对串声消除性能优化的作用,并通过折中考虑CCS的运算效率及系统性能获得了一组最优参数。实验采用通道分离度(CS)和性能误差(PE)两个指标对串声消除效果进行综合评价,仿真结果表明,该组最优参数能获得很好的串声消除效果。
许春冬李军锋裘嫄夏日升颜永红
关键词:三维声音逆滤波
多领域系统融合在语音云系统中的应用
<正>0引言近年来,各大IT公司推出了自己的语音云系统,语音识别技术被大量运用到人们的日常生活中。通过云系统的强大计算能力,用户可利用语音通过移动终端打开手机应用,编辑短信、电子邮件,拨打电话和搜索网页等。各式各样的功能...
陈梦喆张晴晴颜永红
文献传递
利用二重打分方法的激活词语音识别
<正>0引言语音被认为是人与人之间交流最自然的方式之一,自动语音识别(ASR)也是一种重要的人机交互方式。几十年来,众多学者做了大量与语音识别相关的工作,其中的一个方向就是激活词语音识别,也可以称为激活词检测:向机器发出...
邢安昊黎塔颜永红
文献传递
汉语连续语音识别系统中三音子模型的优化被引量:4
2013年
为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。
齐耀辉潘复平葛凤培颜永红
关键词:三音子模型最大后验概率
基于SVM一对一分类的语种识别方法
语种识别系统通常采用支持向量机(SVM)一对多加高斯后端分类器的方法进行分类。传统的SVM一对一分类在进行线性鉴别性分析(LDA)时特征值矩阵往往为奇异的,识别性能很低。本文提出一种改进的一对一分类方法,对SVM一对一得...
王宪亮吴志刚杨金超周若华颜永红
关键词:支持向量机语种识别
共3页<123>
聚类工具0