方绍武
- 作品数:16 被引量:111H指数:5
- 供职机构:中国科学技术大学信息科学技术学院电子科学与技术系更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 一种具有强分类能力的离散HMM训练算法被引量:9
- 2001年
- 提出了一种具有强分类能力的离散 HMM(hidden Markov models)训练算法 .该算法利用矢量量化技术将来自不同话者的训练数据进行混合训练 ,以生成包含各个话者特征的话者特征图案 .用该特征图案代替经典的离散 HMM中的 VQ码本 ,可以提高观察值符号序列的模式辨识能力 ,从而提高了离散 HMM的分类能力 .给出了该方法用于文本有关的话者识别的实验结果 ,表明该算法可提高系统的识别性能 ,并要降低 HMM对训练集大小的依赖程度 ,且识别时计算量明显小于经典 HMM训练算法 。
- 方绍武戴蓓倩李霄寒
- 关键词:矢量量化鲁棒性语音信号处理
- 基于自然进化机制的话者模板优化
- 2000年
- 提出了一种基于自然进化机制的话者模板优化方法,该方法通过对话者训练样本的适应度动态定标,利用交叉、变异和遗传选择操作,可以从有限个话者训练样本集中产生出优化的话者模板,通过话者识别实验,说明这种方法产生的模板较之传统方法产生的模板更好地反映了话者的特征,并且具有更好的时间适应性,同时也减少了对话者语音训练集的依赖。
- 戴蓓倩陆伟方绍武
- 基于话者特征图案的BPNN话者模型被引量:4
- 2002年
- 该文提出了一种用于说话人识别的基于话者特征图案的 BPNN话者模型 ,该话者模型解决了语音信号的时长变化与神经网络输入层结点数固定不变之间的矛盾 .利用 VQ技术对所有话者的语音样本训练出话者特征图案 ,再将语音样本对该特征图案进行映射 ,在映射域解决了语音样本的时间规正问题 .同时 。
- 方绍武戴蓓倩
- 关键词:语音识别人工神经网络
- 基于遗传算法的矢量量化的话者模型被引量:2
- 1999年
- 本文提出了基于遗传算法(GA)的矢量量化话者模型,简称GAVQ话者模型。给出了建立该模型的算法即GAVQ算法。矢量量化技术可以有效地提取和表征话者的个性信息,因而VQ码本可以有效地用作话者模型,传统的VQ码本设计方法是LBG算法,但该算法是一种局部优化算法。GAVQ算法将遗传算法的全局优化特性和VQ建模技术巧妙地结合起来,采用科学的编码方案,动态的定标技术,高效的交叉策略,是一种全局优化的vQ码本设计算法。并进行了实验检验。
- 方绍武戴蓓倩陆伟
- 关键词:遗传算法矢量量化语音识别
- 基于子带VQ及ANN的话者确认系统的设计
- 1999年
- 话者识别系统的时间鲁棒性是影响话者识别系统实用化的关键问题之一。为了提高系统的时间鲁棒性,本文提出了基于子带矢量量化(SBVQ)及人工神经网络(ANN)的话者模型。将语音文本的有效频段划分为几个子带,分别求取于带上的矢量量化码本(SBVQ码本),利用BP型人工神经网络(BPNN)对训练数据在各个子带上的量化误差进行拟合,即可训练出话者模型(SBVQ码本及BPNN的极值矩阵、确认阈值)。该话者模型反映了不同频段对话者识别系统性能的不同影响,并可将时间间隔等因素对系统性能的影响局限在某个子带内从而提高模型的时间鲁棒性。实验表明,本文提出的(SBVQ+BPNN)话者模型具有较好的时间鲁棒性。
- 方绍武戴蓓倩徐文盛刘鸣
- 关键词:鲁棒性语音识别
- 基于连续HMM的孤立语音鲁棒性识别方法被引量:13
- 1999年
- 对于基于连续隐马尔可夫模型(CHMM)的语音识别系统,为了提高系统在环境噪声下的鲁棒性,本文提出了一种能有效抑制加性平稳噪声和通道卷积噪声的相对自相关序列的Mel倒谱参数(RAS_MFCC+△RAS_NFCC),进行特征参数级的去噪,明显地改善了系统的噪声鲁棒性。为了进一步提高系统在低信噪比语音时的识别性能,我们采用了CHMM的混合语青训练法,获得了对各种信噪比语音都具有很强适应性的CHMM参数。实验证明。
- 徐文盛戴蓓倩方绍武李辉
- 关键词:马尔可夫模型鲁棒性语音识别CHMM
- 高阶MFCC的话者识别性能及其噪声鲁棒性被引量:53
- 2001年
- 在一个以MFCC为特征参数的语音识别系统中,人们通常采用低阶的MFCC系数作为语音帧的特征矢量。本文对MFCC的高、低阶系数在与文本有关的话者识别中体现出的识别性能和噪声鲁棒性分别进行了实验分析,发现高阶的MFCC系数在干净环境下对于话者识别而言具有与低阶MFCC系数相当的识别性能,并且当环境信噪比恶劣时,高阶的MFCC系数表现出比低阶MFCC系数更强的噪声鲁棒性。基于这个结果,本文将高阶系数的取值范围进一步向低阶拓展,只滤除最易受噪声影响的几个系数,并与Delta参数相结合形成新的特征矢量。实验证明,这种经过适当选取的MFCC系数同时具有良好的话者识别性能和噪声鲁棒性。
- 李霄寒戴蓓倩方绍武刘鸣
- 关键词:话者识别噪声鲁棒性语音信号处理
- 特定人汉语数码语音抗噪识别方法被引量:2
- 2000年
- 本文提出一种连续隐马尔可夫模型(CHMM)和人工神经网络(ANN)相结合的鲁棒性识别方法,用于噪声环境下特定人数码语音识别。该方法以CHMM的输出作为系统的识别矢量,利用人工神经网络的模式分类和自学习功能,从识别矢量空间中提取语音预识别矢量,再由识别矢量对预识别结果进行识别输出。实验证明,这种基于CHMM/ANN的数码语音识别方法明显地提高了系统的噪声鲁棒性,适用于中小词表语音识别系统。
- 徐文盛戴蓓倩方绍武陆伟
- 关键词:汉语特定人神经网络噪声鲁棒性
- 一种抗噪孤立字语音识别模型被引量:9
- 2000年
- 论文提出了一种连续隐Markov模型和BP神经网络相结合的、具有两次辨识过程的抗噪孤立字识别模型 .首先以连续隐Markov模型完成语音信号的时序建模并提供一次识别信息 ;以BP神经网络进行后处理 ,提取二次识别信息 ,识别结果由两次识别信息共同决定 .实验证明 ,由于有效地利用了隐Markov模型的强时序信号处理能力和BP神经网络的强模式分类和泛化性能 ,这种识别模型明显地改善了孤立字识别系统的抗噪性能 .
- 徐文盛戴蓓倩方绍武李辉
- 关键词:人工神经网络噪声鲁棒性语音识别抗噪性能
- VQ话者模型中失真测度的鲁棒性研究被引量:3
- 2000年
- 文中研究表明 ,反映说话人特征信息的特征参数矢量的各个分量通常具有不同的分布 ,对正确识别说话人身份的有效性是有差别的。文中将这种有效性差别作为权重矢量反映到失真测度计算公式中 ,提出了一种新的失真测度 ,即方差归一化失真测度。该失真测度可有效提高话者识别系统的识别性能。进一步的实验还表明 ,该失真测度能提高话者识别系统的时间鲁棒性。文中同时还给出了适合于话者识别的参数归正方法 :帧内幅度归正。
- 方绍武戴蓓倩
- 关键词:鲁棒性话者识别