唐晖
- 作品数:5 被引量:3H指数:1
- 供职机构:解放军信息工程大学信息工程学院更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- VoIP压缩码流说话人识别研究被引量:2
- 2009年
- 研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729,G.723.1(6.3Kb/s),G.723.1(5.3Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GMM模型,微聚类算法在识别正确率和效率上都有很大的提高。
- 唐晖李弼程屈丹张连海
- 关键词:说话人识别
- 基于遗传K-均值算法的LSF参数码书设计
- 2007年
- 文章提出了一种基于遗传K-均值算法的线谱频率参数(LSF)码书设计方法。该方法使用K-均值算法定义遗传操作中的交叉操作,采用训练矢量随机替换码书码字的方法进行变异操作。实验结果表明:该方法是有效的,在相同的码书尺寸下,用该量化器设计的LSF码书较传统分裂式LBG算法(初始码书由分裂法产生)设计的码书质量有所提高。
- 唐晖李弼程张连海张文林王晓燕
- 关键词:矢量量化
- 基于统计匹配的VoIP说话人特征补偿算法被引量:1
- 2009年
- 在VoIP说话人识别中,当使用原始语音(未经过编译码处理)训练的说话人模型识别经过语音编译码处理的测试语音时,系统的识别性能会发生下降。本文给出了一种基于统计匹配和EM(期望最大化)算法的VoIP说话人特征(12阶的LPCC系数)补偿算法,其中对假设失真特征与未失真识别特征间符合非线性(二次函数型)和线性函数关系时的函数参数进行了估计,并使用得到的补偿函数对失真特征进行补偿。实验结果表明,该特征补偿算法对VoIP中广泛使用的G.729 8kb/s、G.723.16.3kb/s、G.723.15.3kb/s编译码所造成的识别性能下降有较大的改善,其性能也优于CMS(倒谱均值减)方法。
- 唐晖李弼程屈丹张连海
- 关键词:VOIP说话人识别EM算法
- G.729编码流说话人识别研究
- 2008年
- 研究了G.729编码流说话人识别算法,提出了一种使用固定码书增益作为判决参数的G.729静音帧判决方法。将这一方法应用于低复杂度的G.729编码流说话人识别,去除压缩语音数据中的静音帧从而提高识别率。
- 唐晖李弼程
- 关键词:说话人识别G.729
- 基于概率统计直方图的压缩域说话人识别
- 2009年
- 压缩域说话人识别算法(Compressed-domain automatic speaker recognition,CD-ASR)即从压缩语音数据中直接提取压缩参数进行说话人识别,无需参数译码和波形合成。本文提出了基于概率统计直方图的VoIP压缩域说话人识别算法,包括矢量量化统计直方图和高斯混合模型统计直方图两种方法。在给出了G.729,G.723.1(6.3 kb/s),G.723.1(5.3 kb/s)压缩码流的压缩域特征提取方案后,分别以矢量量化统计直方图和高斯混合模型统计直方图作为识别模型进行说话人识别。实验结果表明,概率统计直方图法比在压缩码流中提取同样识别参数的GMM模型,识别率有很大提高。
- 屈丹闫红刚唐晖王炳锡