许东星
- 作品数:7 被引量:7H指数:2
- 供职机构:中国科学技术大学信息科学技术学院电子科学与技术系更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于多微商核函数的SVM话者确认
- 2011年
- 给出了一种基于多微商核函数(MDK)的结合高斯混合模型(GMM)和支持向量机(SVM)的方法,并应用于SVM文本无关话者确认。从GMM话者语音特征概率分布出发,用多阶微商描述GMM概率分布,将GMM和SVM结合的问题转化为用多阶微商建立SVM话者模型的问题。首先对说话人语音进行基于因子分析的参数域失配补偿,用GMM描述失配补偿后的话者语音特征的概率分布;然后对GMM求多阶微商;最后构建多微商核函数,建立多SVM话者模型。在NIST’01 2min-1min话者确认数据库上的实验表明,基于多微商核函数的SVM话者确认系统性能优于基于失配补偿的GMM系统,也比基于失配补偿的Fisher核函数SVM话者系统和基于失配补偿的Kullback-Leibler(KL)距离SVM话者系统有较大的提高。
- 许敏强戴蓓蒨刘青松许东星
- 关键词:话者确认支持向量机
- 声母发声特点参数的提取及其提高说话人确认鲁棒性的研究被引量:2
- 2009年
- 本文针对语音信号中的声母语音更易受环境噪声污染而导致识别性能下降的情况,根据普通话声母发声位置特点,提出了一种对发声位置状态描述的发声特点参数(Articulatory Feature,简称AF),采用特征空间映射方法,由短时倒谱参数(MFCC)经MLP特征映射网络映射获取,MLP特征映射网络则由语言学先验知识事先训练得到。AF参数具有良好的噪声鲁棒性,并与MFCC参数具有互补性,由MFCC和AF组成的联合特征参数(MFCC-AF)可使系统确认性能的鲁棒性有明显的改善。在微软数据库上的基于GMM-UBM模型的与文本无关的说话人确认实验表明,对于声母语音,采用MFCC-AF参数使系统的鲁棒性有明显的改善:在干净、25dB、20dB条件下,较只采用MFCC参数的系统的EER分别相对降低了5.4%,14.12%,20.27%。
- 许东星戴蓓蒨许敏强刘青松
- 关键词:发声特点多层感知器文本无关说话人确认
- 基于失配信息子空间失配补偿的话者确认
- 2010年
- 对于电话手机语音的文本无关说话人确认,语音受到传输信道、话筒等的影响,失配问题尤为显著.为此提出一种GMM-UBM框架下基于失配信息子空间的说话人确认失配补偿方法,该方法利用失配信息子空间和基准信息模型获得训练和测试语音的相对失配信息,此失配信息是失配信息子空间中超矢量的一种线性组合,补偿更为准确,能够根据失配对不同语音类的不同影响,对不同的语音类进行相应的补偿.NIST06数据库上的实验表明,经过失配补偿的系统性能在EER和MinDCF有近50%的提高.
- 刘青松戴蓓蒨许东星吴德辉
- 关键词:说话人确认
- 基于GMM和高层信息特征的文本无关说话人识别研究
- 为了考察和衡量文本无关的说话人识别的最新研究发展状况,美国国家标准与技术署/(NIST/)自1996年起开始举办说话人识别评测/(SRE/)。NIST说话人评测代表了了说话人识别领域的最先进水平,NIST设立了多项任务,...
- 许东星
- 关键词:文本无关概率统计说话人确认
- 文献传递
- 基于超音段韵律特征和GMM-UBM的文本无关的说话人识别被引量:1
- 2010年
- 提出一种采用超音段韵律特征和GMM-UBM模型结构的文本无关的说话人识别方法,用多尺度小波分析方法从短时倒谱参数MFCC和基频F0随时间变化的韵律中分别提取可用于文本无关说话人识别的超音段韵律特征参数PMFCC和PF0,并组成联合参数PMFCCF0.在NIST068side-1side复杂背景电话手机语音数据库上的说话人确认实验则表明,采用一阶小波分析方法提取的超音段韵律参数PMFCC的识别性能与短时MFCC相当,采用超音段韵律特征PMFCCF0的系统确认性能比采用短时MFCC系统有较大的提高.在微软数据库进行不同信噪比测试语音的说话人辨认实验表明,PMFCCF0有比短时MFCC更好的噪声鲁棒性.
- 许东星戴蓓蒨刘青松许敏强
- 关键词:文本无关说话人识别
- 基于韵律特征的SVM说话人确认被引量:2
- 2011年
- 提出了一种基于韵律特征和SVM的文本无关说话人确认系统。采用小波分析方法,从语音信号的MFCC、F0和能量轨迹中提取出超音段韵律特征,通过实验研究三者的韵律特征在特征层的最佳互补融合,得到信号的韵律特征PMFCCFE,用韵律特征的GMM均值超矢量作为参数训练目标话者的SVM模型,以更有效地区分目标话者和冒认话者。在NIST068side-1side数据库的实验表明,以短时倒谱参数的GMM-UBM系统为基准,超音段韵律特征的GMM-SVM系统的EER相对下降了57.9,MinDCF相对下降了41.4。
- 黄肖忠李辉许东星郭伟
- 关键词:韵律特征支持向量机
- 基于GMM和二分类特征筛选的多级音频分类方法
- 2007年
- 采用同一种特征参数——Mel倒谱系数及其动态参数区分纯语音、带背景语音、乐器音、歌声和环境音.根据该特征参数的特点以及各类音频之间的差异,给出了一种区分性模型训练和特征筛选相结合的多级二分类音频分类方法,即为各级建立GMM(Gaussian mixture model)模型的同时挑选出使当前模型区分程度达到最大的特征子集.对长约2 h的音频数据集的测试结果表明,该方法相对于特征筛选前的分类系统,平均误识率下降了约23.5%,且各二分类子系统的特征维数也有明显地减少.
- 高前勇戴蓓蒨许东星
- 关键词:音频分类