您的位置: 专家智库 > >

国家自然科学基金(11074275)

作品数:11 被引量:31H指数:4
相关作者:颜永红许春冬李军锋应冬文夏日升更多>>
相关机构:中国科学院江西理工大学北京理工大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
相关领域:电子电信自动化与计算机技术交通运输工程建筑科学更多>>

文献类型

  • 9篇期刊文章
  • 7篇会议论文

领域

  • 14篇电子电信
  • 1篇自动化与计算...
  • 1篇交通运输工程
  • 1篇医药卫生

主题

  • 7篇语音
  • 3篇语音识别
  • 3篇语音增强
  • 3篇说话人识别
  • 3篇混合模型
  • 3篇高斯
  • 3篇高斯混合
  • 3篇高斯混合模型
  • 2篇倒谱
  • 2篇倒谱系数
  • 2篇序贯
  • 2篇谱系数
  • 2篇功率谱
  • 2篇感知
  • 2篇HMM
  • 1篇多特征融合
  • 1篇信号
  • 1篇抑制方法
  • 1篇隐MARKO...
  • 1篇隐马尔可夫模...

机构

  • 12篇中国科学院
  • 3篇北京理工大学
  • 3篇江西理工大学
  • 1篇内蒙古师范大...
  • 1篇上海海洋大学
  • 1篇国家互联网应...

作者

  • 8篇颜永红
  • 3篇李军锋
  • 3篇许春冬
  • 2篇夏日升
  • 2篇付强
  • 2篇应冬文
  • 1篇姜开宇
  • 1篇张晴晴
  • 1篇陈梦喆
  • 1篇王宪亮
  • 1篇吴超
  • 1篇李艳玲
  • 1篇杨琳
  • 1篇张建平
  • 1篇梁春燕
  • 1篇国雁萌
  • 1篇张翔
  • 1篇王晓飞
  • 1篇许云飞
  • 1篇张震

传媒

  • 3篇声学学报
  • 3篇Chines...
  • 1篇电子与信息学...
  • 1篇计算机应用
  • 1篇Journa...

年份

  • 1篇2017
  • 3篇2014
  • 8篇2013
  • 3篇2012
  • 1篇2011
11 条 记 录,以下是 1-10
排序方式:
两扬声器配置下的串声消除系统参数优化设置被引量:1
2014年
针对三维声音两扬声器重放中基本上独立研究逆滤波器的设计或扬声器的配置等因素对串声消除系统(CCS)性能的影响,提出了采用频域最小均方(LS)估计逼近方法,系统考察这些因素之间的关联以及对串声消除性能优化的作用,并通过折中考虑CCS的运算效率及系统性能获得了一组最优参数。实验采用通道分离度(CS)和性能误差(PE)两个指标对串声消除效果进行综合评价,仿真结果表明,该组最优参数能获得很好的串声消除效果。
许春冬李军锋裘嫄夏日升颜永红
关键词:三维声音逆滤波
Perceptual MVDR-based cepstral coefficients(PMCCs)for speaker recognition被引量:2
2012年
A feature extraction technique named perceptual MVDR-based cepstral coefficients (PMCCs) was introduced into speaker recognition.PMCCs are extracted and modeled using Gaussian Mixture Models(GMMs) for speaker recognition.In order to compensate for speaker and channel variability effects,joint factor analysis(JFA) is used.The experiments are carried out on the core conditions of NIST 2008 speaker recognition evaluation data.The experimental results show that the systems based on PMCCs can achieve comparable performance to those based on the conventional MFCCs.Besides,the fusion of the two kinds of systems can make significant performance improvement compared to the MFCCs system alone,reducing equal error rate(EER) by the factor between 7.6%and 30.5%as well as minimum detect cost function (minDCF) by the factor between 3.2%and 21.2%on different test sets.The results indicate that PMCCs can be effectively applied in speaker recognition and they are complementary with MFCCs to some extent.
LIANGChunyan ZHANG Xiang YANG Lin ZHANG Jianping YAN Yonghong
关键词:说话人识别MVDR倒谱系数感知高斯混合模型
多领域系统融合在语音云系统中的应用
<正>0引言近年来,各大IT公司推出了自己的语音云系统,语音识别技术被大量运用到人们的日常生活中。通过云系统的强大计算能力,用户可利用语音通过移动终端打开手机应用,编辑短信、电子邮件,拨打电话和搜索网页等。各式各样的功能...
陈梦喆张晴晴颜永红
文献传递
利用二重打分方法的激活词语音识别
<正>0引言语音被认为是人与人之间交流最自然的方式之一,自动语音识别(ASR)也是一种重要的人机交互方式。几十年来,众多学者做了大量与语音识别相关的工作,其中的一个方向就是激活词语音识别,也可以称为激活词检测:向机器发出...
邢安昊黎塔颜永红
文献传递
基于空间声场扩散信息的混响抑制方法
在远讲语音应用中,房间混响严重影响了语音的质量和主观听觉感受。在信号源与系统均未知的前提下,当前的混响抑制方法普遍存在混响不能准确建模的问题。本文利用双通道混响语音信号,根据语音直达声和混响声所反映出的声场扩散信息,提出...
王晓飞姜开宇国雁萌付强颜永红
关键词:语音增强功率谱
基于PLDA的“一对多”下的说话人确认方法研究
近年来,概率线性鉴别分析(Probabilistic Linear Discriminant Analysis,PLDA)因其优异的性能而得到学者们的广泛关注。然而,各主流单位的PLDA研究都是基于NISTSRE 201...
许云飞黄厚军金怡珠李桂莲周若华
关键词:说话人识别
多特征融合的英语口语考试自动评分系统的研究被引量:10
2012年
该文主要针对大规模英语口语考试自动评分系统的问答题型,采用多特征融合的方法进行评分。以语音识别文本作为研究对象,提取了3类特征进行评分。这3类特征分别是:相似度特征、句法特征和语音特征。总共9个特征从不同方面描述了考生回答与专家评分之间的关系。在相似度特征中,改进了Manhattan距离作为相似度。同时提出了基于编辑距离的关键词覆盖率的特征,充分考虑了识别文本中存在的单词变异现象,为给考生一个客观公平的分数提供依据。所有提取的特征利用多元线性回归模型进行融合,得到机器评分。实验结果表明,提取的特征对机器评分是十分有效的,并且在以考生为单位的系统评分性能达到了专家评分性能的98.4%。
李艳玲颜永红
关键词:自动语音识别自动评分句法树
基于SVM一对一分类的语种识别方法
语种识别系统通常采用支持向量机(SVM)一对多加高斯后端分类器的方法进行分类。传统的SVM一对一分类在进行线性鉴别性分析(LDA)时特征值矩阵往往为奇异的,识别性能很低。本文提出一种改进的一对一分类方法,对SVM一对一得...
王宪亮吴志刚杨金超周若华颜永红
关键词:支持向量机语种识别
基于HMM-BIC的说话人日志系统
该文提出一种改进的基于隐Markov模型(HMM)和Bayes信息准则(BIC)的说话人日志系统。它用来检测会议语音数据中"谁在什么时候说话"。在对说话人模型进行Gauss混合模型(GMM)建模的时候,考虑到用来建模的数...
周瑜金怡珠李桂莲
关键词:最大后验概率隐MARKOV模型
文献传递
Acoustic characteristics of stop consonants in fluent reading Chinese Putonghua speech of adult stutterers被引量:1
2013年
This study investigated whether adults who stutter and normal adult speakers differ in the production of stop consonants in fluent reading Chinese Putonghua speech.Voice onset time(VOT) was measured and the spectral moments at the stop burst were calculated for the stutterers(both before and after the speech therapy) and also for the nonstutterers. The statistical results showed that there were no significant differences in VOT between the nonstutterers and stutterers either prior to or after therapy,although the mean VOT of the stutterers was slightly greater than that of the nonstutterers.The results also indicated that both the obstruction place and the subsequent syllabic final exhibited an influence to a greater extent on VOT for the stutterers.In the spectral domain,the spectral mean of the stuttering participants before therapy was significantly different from that of the normal participants, whereas the group difference became insignificant after the therapy session.The smaller spectral mean for the stutterers might be interpreted as a more posterior occlusion in the oral cavity when producing alveolars and velars.In addition,productions of the stutterers scattered with a wider range in the space of spectral moments.Furthermore,the smaller main effect of syllabic finals on the mean spectral frequency of the burst suggested that the stutterers exhibited weaker anticipatory coarticulation than the nonstutterers.
FENG YongqiangYAN QianGAO XinglongPAN FupingXING LiliLIN ChunlanPAN Jielin
关键词:声学特性成年正常成人
共2页<12>
聚类工具0