许敏强
- 作品数:8 被引量:3H指数:1
- 供职机构:中国科学技术大学信息科学技术学院电子科学与技术系更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于分类特征映射的SVM话者确认
- 2010年
- 为了解决与文中无关的话者确认,大量训练样本数据所导致的建立支持向量机SVM(SupportVectorMachine)话者模型困难,文中提出了一种基于基音分类特征映射和支持向量机的话者确认系统,首先根据基音周期将语音倒谱参数在特征空间上分类,再利用GMM-UBM结构进行特征映射,获得每个特征子空间中的话者特征参数并建立SVM话者模型。基音分类特征映射不仅使得样本数据极大地压缩,而且让子空间中SVM分类界面具有更好的区分性,因此,对各分类子系统评分融合之后的总系统具有更好话者确认性能。在NIST’06数据库上的实验证明了该方法的有效性。
- 贺庆玮李辉许敏强
- 关键词:基音周期高斯混合模型特征映射支持向量机话者确认
- 基于语音质量的话者确认方法研究
- 2011年
- 针对传统的手机电话语音的说话人确认中,未考虑训练语音和测试语音信号本身质量对识别效果的影响问题,采用语音质量测量的方法对GMM-UBM方法进行改进,提出了利用多维基音参数,将基音偏离作为语音信号质量测量准则的方法,对GMM-UBM系统短时谱参数评分过程进行修正,得到基于语音信号质量的评分方法.通过在NIST SRE 2006 1side数据库中男性话者的实验表明,采用语音质量的评分方法能够有效提高系统的识别率,系统的等误识率和检测代价函数都有一定程度的改进.
- 高二中李辉郭立许敏强
- 关键词:基音频率
- 基于多微商核函数的SVM话者确认
- 2011年
- 给出了一种基于多微商核函数(MDK)的结合高斯混合模型(GMM)和支持向量机(SVM)的方法,并应用于SVM文本无关话者确认。从GMM话者语音特征概率分布出发,用多阶微商描述GMM概率分布,将GMM和SVM结合的问题转化为用多阶微商建立SVM话者模型的问题。首先对说话人语音进行基于因子分析的参数域失配补偿,用GMM描述失配补偿后的话者语音特征的概率分布;然后对GMM求多阶微商;最后构建多微商核函数,建立多SVM话者模型。在NIST’01 2min-1min话者确认数据库上的实验表明,基于多微商核函数的SVM话者确认系统性能优于基于失配补偿的GMM系统,也比基于失配补偿的Fisher核函数SVM话者系统和基于失配补偿的Kullback-Leibler(KL)距离SVM话者系统有较大的提高。
- 许敏强戴蓓蒨刘青松许东星
- 关键词:话者确认支持向量机
- 声母发声特点参数的提取及其提高说话人确认鲁棒性的研究被引量:2
- 2009年
- 本文针对语音信号中的声母语音更易受环境噪声污染而导致识别性能下降的情况,根据普通话声母发声位置特点,提出了一种对发声位置状态描述的发声特点参数(Articulatory Feature,简称AF),采用特征空间映射方法,由短时倒谱参数(MFCC)经MLP特征映射网络映射获取,MLP特征映射网络则由语言学先验知识事先训练得到。AF参数具有良好的噪声鲁棒性,并与MFCC参数具有互补性,由MFCC和AF组成的联合特征参数(MFCC-AF)可使系统确认性能的鲁棒性有明显的改善。在微软数据库上的基于GMM-UBM模型的与文本无关的说话人确认实验表明,对于声母语音,采用MFCC-AF参数使系统的鲁棒性有明显的改善:在干净、25dB、20dB条件下,较只采用MFCC参数的系统的EER分别相对降低了5.4%,14.12%,20.27%。
- 许东星戴蓓蒨许敏强刘青松
- 关键词:发声特点多层感知器文本无关说话人确认
- 基于高维空间映射失配补偿方法的说话人确认
- 2010年
- 针对电话手机语音的文本无关说话人确认中,训练集语音和测试集语音来自不同信道所产生失配而导致系统性能下降的问题,采用一种基于高维空间映射的方法对系统进行补偿.在分析了已有的说话人确认系统的基础上,提出了一种基于特征参数映射支持向量机模型(PSVM)的说话人确认系统.首先用大量已知信道类型的语音训练出信道空间及映射矩阵,然后训练语音和测试语音都通过映射,消除因信道不同而导致的失配影响.在NIST数据库上的实验结果表明,这种方法弥补了训练语音和测试语音的失配,说话人确认系统的性能有了明显的提高.
- 郭伟李辉许敏强刘青松
- 关键词:说话人确认
- 基于超音段韵律特征和GMM-UBM的文本无关的说话人识别被引量:1
- 2010年
- 提出一种采用超音段韵律特征和GMM-UBM模型结构的文本无关的说话人识别方法,用多尺度小波分析方法从短时倒谱参数MFCC和基频F0随时间变化的韵律中分别提取可用于文本无关说话人识别的超音段韵律特征参数PMFCC和PF0,并组成联合参数PMFCCF0.在NIST068side-1side复杂背景电话手机语音数据库上的说话人确认实验则表明,采用一阶小波分析方法提取的超音段韵律参数PMFCC的识别性能与短时MFCC相当,采用超音段韵律特征PMFCCF0的系统确认性能比采用短时MFCC系统有较大的提高.在微软数据库进行不同信噪比测试语音的说话人辨认实验表明,PMFCCF0有比短时MFCC更好的噪声鲁棒性.
- 许东星戴蓓蒨刘青松许敏强
- 关键词:文本无关说话人识别
- 基于话者统计特征和SVM的文本无关话者确认研究
- 随着信息化地不断深入,话者确认等身份识别方法越来越受到人们的重视。话者确认,尤其是用户界面友好的与文本无关的话者确认,以其广阔的市场前景,吸引了越来越多的研究人员的重视,成为目前研究的重点。
话者确认是一个分类问题...
- 许敏强
- 关键词:话者确认身份识别支持向量机
- 基于自适应高斯混合模型特征映射的说话人确认
- 2009年
- 为了解决电话语音说话人确认系统中信道非线性失真导致系统性能下降的问题,提出一种消除信道影响的特征映射方法.采用高斯混合模型建立语音模型,通过最大后验概率自适应某种信道的语音模型,两种模型间相应高斯类的差异描述了该信道对于不同语音的影响.由此得出信道映射规则进行参数补偿,消除训练和测试语音中不匹配的影响.在NIST 1999年和2004年男性说话人的数据库上进行的实验表明,此方法使系统的等错误率分别改善了14.7%和15.18%.
- 杨世清戴蓓蒨许敏强刘青松
- 关键词:说话人确认