您的位置: 专家智库 > >

霍英东基金(131059)

作品数:2 被引量:2H指数:1
相关作者:谢磊杨鹏陈虹洁樊博朱鹏程更多>>
相关机构:西北工业大学更多>>
发文基金:陕西省自然科学基金霍英东基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 2篇会议论文

领域

  • 2篇电子电信
  • 2篇自动化与计算...

主题

  • 4篇语音
  • 2篇语音驱动
  • 2篇中文
  • 2篇中文语音
  • 1篇动态时间规整
  • 1篇隐MARKO...
  • 1篇神经网
  • 1篇神经网络
  • 1篇DTW
  • 1篇SEGMEN...

机构

  • 4篇西北工业大学

作者

  • 4篇谢磊
  • 2篇李冰锋
  • 2篇陈虹洁
  • 2篇朱鹏程
  • 2篇杨鹏
  • 2篇樊博

传媒

  • 2篇清华大学学报...

年份

  • 4篇2013
2 条 记 录,以下是 1-4
排序方式:
基于SDTW和后验特征的中文语音模式发现
语音模式发现是从语音流中检测出重复出现的音节、词或短语等语音单元的任务,是众多语音与语言处理任务中的一项基础工作。本文基于分段DTW(SDTW)算法,尝试直接在中文语料上进行语音模式发现。主要工作包括两方面。1)MFCC...
杨鹏谢磊陈虹洁
关键词:DTW
语音驱动虚拟说话人的自然头动生成
本文研究了从语音信号预测伴随头动的方法。基于HMM的头动合成方法的效果有赖于头动模式的划分和头动模式的正确识别。为此,本文尝试了不同头动模式划分方法的头动合成效果。由于语音和头动之间是非确定性的多对多的映射关系,很难用固...
李冰锋谢磊朱鹏程樊博
语音驱动虚拟说话人的自然头动生成
2013年
从语音信号预测伴随头动时,基于隐Markov模型(hidden Markov model,HMM)的头动合成方法的效果依赖于头动模式的划分和头动模式的正确识别。该文尝试了不同头动模式划分方法的头动合成效果。由于语音和头动之间是非确定性的多对多的映射关系,很难用固定的类别描述清楚,因此该类方法的头动模式识别率不高,头动合成效果受限。该文尝试采用逆传播(back-propagation,BP)神经网络的非线性回归方法,通过学习语音与头动之间的映射关系,实现语音信号到头动参数之间的直接连续映射,避免了HMM方法中头动模式不明确、头动模式识别错误带来的负面影响。实验表明,基于BP神经网络的回归方法有效地提高了语音到头动预测的准确度和头动合成的自然度。
李冰锋谢磊朱鹏程樊博
关键词:隐MARKOV模型神经网络
基于分段动态时间规整和后验特征的中文语音模式发现被引量:2
2013年
语音模式发现是从语音流中检测出重复出现的音节、词或短语等语音单元的任务。该文基于分段动态时间规整(segmental dynamic time warping,SDTW)算法,尝试直接在中文语料上进行语音模式发现。Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征在衡量两个语音片段声学相似度上不够鲁棒,特别是针对多说话人语料,语音模式发现的效果大打折扣。该文尝试了基于音素后验概率(posteriorgram)的特征表示方法。实验表明:在多说话人和单说话人的语料上,音素后验特征均可以得到比MFCC更好的效果。该文尝试了用词边界确定分段进行语音模式发现,这种设置可以看作基于SDTW进行模式发现的效果上限。实验表明:在预知词边界的情况下,效率和正确率都得到了明显提升。
杨鹏谢磊陈虹洁
关键词:动态时间规整
共1页<1>
聚类工具0