国家自然科学基金(91120001) 作品数:17 被引量:33 H指数:4 相关作者: 颜永红 许春冬 李军锋 应冬文 张震 更多>> 相关机构: 中国科学院 北京理工大学 江西理工大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 中国科学院战略性先导科技专项 更多>> 相关领域: 电子电信 自动化与计算机技术 医药卫生 更多>>
融合词义消歧的汉语句法分析方法研究 被引量:2 2015年 将句法分析与词义消歧相结合,根据层次化语义知识的句法分析框架,在句法分析训练过程中,利用句法结构信息对文法模型进行调整,解决了引入语义时所面对的歧义问题,构建一种句法分析和词义消歧的一体化方法。实验表明,在句法分析过程中进行词义消歧处理,使句法分析的性能显著提升,同时也获得词义消歧能力。 李冬晨 张献涛 樊扬 吴玺宏关键词:句法分析 词义消歧 一体化 一种小资源下语音识别算法设计与优化 在可穿戴设备和智能家居系统的实际应用中,语音识别引擎需要占用极小的资源并具有较强的拒识能力。传统的语音识别算法无法满足小资源的这种需求,本文在解码策略和拒识算法设计上均提出了改进方法。解码策略方面,通过修改垃圾音素的重入... 张鹏远 计哲 侯炜 金鑫 韩卫生关键词:语音识别 置信度 文献传递 基于NMF和FCRF的单通道语音分离 被引量:1 2017年 近年来,非负矩阵分解(non-negative matrix factorization,NMF)被广泛应用于单通道语音分离问题。然而,标准的NMF算法假设语音的相邻帧之间是相互独立的,不能表征语音信号的时间连续性信息。为此,该文提出了一种基于NMF和因子条件随机场(factorial conditional random field,FCRF)的语音分离算法,首先将NMF和k均值聚类结合对纯净语音的频谱结构以及时间连续性进行建模,然后利用得到的模型训练FCRF模型,进而对混合语音信号进行分离。结果表明:该算法相比没有考虑语音时间连续特性的基于NMF的算法如激活集牛顿算法(active-set Newton algorithm,ASNA),在客观指标上有明显提高。 李煦 屠明 吴超 国雁萌 纳跃跃 付强 颜永红关键词:非负矩阵分解 K均值聚类 基于PLDA的“一对多”下的说话人确认方法研究 近年来,概率线性鉴别分析(Probabilistic Linear Discriminant Analysis,PLDA)因其优异的性能而得到学者们的广泛关注。然而,各主流单位的PLDA研究都是基于NISTSRE 201... 许云飞 黄厚军 金怡珠 李桂莲 周若华关键词:说话人识别 基于DNN的声学模型自适应实验 被引量:5 2015年 声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关的自动语音识别任务,对典型的两种声学模型自适应算法进行了尝试,实验了基于线性变换网络的自适应方法和基于相对熵正则化准则的自适应方法,并对两种算法进行了详尽的系统性能比较.结果表明,在不同的自适应数据量下,相对熵正则化自适应方法均能表现出较好的性能. 张宇 计哲 万辛 张震 葛凤培 颜永红关键词:语音识别 两扬声器配置下的串声消除系统参数优化设置 被引量:1 2014年 针对三维声音两扬声器重放中基本上独立研究逆滤波器的设计或扬声器的配置等因素对串声消除系统(CCS)性能的影响,提出了采用频域最小均方(LS)估计逼近方法,系统考察这些因素之间的关联以及对串声消除性能优化的作用,并通过折中考虑CCS的运算效率及系统性能获得了一组最优参数。实验采用通道分离度(CS)和性能误差(PE)两个指标对串声消除效果进行综合评价,仿真结果表明,该组最优参数能获得很好的串声消除效果。 许春冬 李军锋 裘嫄 夏日升 颜永红关键词:三维声音 逆滤波 多领域系统融合在语音云系统中的应用 <正>0引言近年来,各大IT公司推出了自己的语音云系统,语音识别技术被大量运用到人们的日常生活中。通过云系统的强大计算能力,用户可利用语音通过移动终端打开手机应用,编辑短信、电子邮件,拨打电话和搜索网页等。各式各样的功能... 陈梦喆 张晴晴 颜永红文献传递 利用二重打分方法的激活词语音识别 <正>0引言语音被认为是人与人之间交流最自然的方式之一,自动语音识别(ASR)也是一种重要的人机交互方式。几十年来,众多学者做了大量与语音识别相关的工作,其中的一个方向就是激活词语音识别,也可以称为激活词检测:向机器发出... 邢安昊 黎塔 颜永红文献传递 汉语连续语音识别系统中三音子模型的优化 被引量:4 2013年 为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。 齐耀辉 潘复平 葛凤培 颜永红关键词:三音子模型 最大后验概率 基于SVM一对一分类的语种识别方法 语种识别系统通常采用支持向量机(SVM)一对多加高斯后端分类器的方法进行分类。传统的SVM一对一分类在进行线性鉴别性分析(LDA)时特征值矩阵往往为奇异的,识别性能很低。本文提出一种改进的一对一分类方法,对SVM一对一得... 王宪亮 吴志刚 杨金超 周若华 颜永红关键词:支持向量机 语种识别