您的位置: 专家智库 > >

张陈昊

作品数:4 被引量:3H指数:1
供职机构:清华大学计算机科学与技术系更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 2篇会议论文

领域

  • 3篇电子电信
  • 1篇自动化与计算...

主题

  • 2篇说话人辨认
  • 1篇音素
  • 1篇语音
  • 1篇语音识别
  • 1篇说话人确认
  • 1篇说话人确认系...
  • 1篇说话人识别
  • 1篇文本无关
  • 1篇鲁棒
  • 1篇鲁棒性
  • 1篇类模型
  • 1篇感知

机构

  • 4篇清华大学
  • 1篇太原理工大学
  • 1篇奥克兰大学

作者

  • 4篇张陈昊
  • 4篇郑方
  • 3篇王琳琳
  • 2篇邬晓钧
  • 1篇尹聪
  • 1篇龚宬
  • 1篇白静

传媒

  • 2篇清华大学学报...

年份

  • 2篇2013
  • 2篇2011
4 条 记 录,以下是 1-4
排序方式:
基于多音素类模型的文本无关短语音说话人识别被引量:1
2013年
对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素类模型混合(KPCMMM)的建模方法。在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决,K是选取的相近音素类数。由于音素类定义的不同,KPCMMM方法分为基于专家知识和数据驱动这两类。实验结果显示选择合适的K值可以得到更好的识别结果。不同的音素类定义方法的比较实验结果显示:当测试语音时长小于2s时,对比GMM-UBM基线系统,该方法的等错误率(EER)相对下降38.60%。
张陈昊郑方王琳琳
关键词:语音识别
基于参考说话人模型和双层结构的说话人辨认快速算法
王刚邬晓钧郑方王琳琳张陈昊
基于参考说话人模型和双层结构的说话人辨认快速算法
王刚邬晓钧郑方王琳琳张陈昊
基于PLAR的说话人确认系统的噪音鲁棒性被引量:2
2013年
针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。
尹聪白静龚宬张陈昊郑方Waleed H.Abdulla
关键词:说话人确认鲁棒性
共1页<1>
聚类工具0