您的位置: 专家智库 > >

徐英进

作品数:7 被引量:5H指数:1
供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
发文基金:国家自然科学基金更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 2篇会议论文
  • 2篇科技成果

领域

  • 5篇电子电信
  • 3篇自动化与计算...

主题

  • 5篇语音
  • 4篇语音合成
  • 2篇时长
  • 2篇双语
  • 2篇海量
  • 2篇汉语语音合成
  • 2篇HMM
  • 1篇多模态
  • 1篇多语种
  • 1篇音乐检索
  • 1篇音频
  • 1篇音频检索
  • 1篇语境
  • 1篇语境特征
  • 1篇数据库
  • 1篇数据库管理
  • 1篇说话人
  • 1篇说话人自适应
  • 1篇自适
  • 1篇自适应

机构

  • 6篇清华大学
  • 1篇香港中文大学

作者

  • 7篇徐英进
  • 7篇蔡莲红
  • 3篇贾珈
  • 2篇王永鑫
  • 2篇吴志勇
  • 2篇蒙美玲
  • 2篇王愈
  • 2篇蔡锐
  • 2篇钟玉琢
  • 1篇王永鑫
  • 1篇宁辉
  • 1篇谢全辉
  • 1篇袁春
  • 1篇袁春
  • 1篇许佩瑜
  • 1篇黄嘉豪
  • 1篇黄嘉豪
  • 1篇李煜智
  • 1篇叶振兴
  • 1篇崔丹丹

传媒

  • 1篇清华大学学报...
  • 1篇计算机工程
  • 1篇中国科技论文
  • 1篇第二届和谐人...

年份

  • 2篇2013
  • 1篇2012
  • 1篇2009
  • 1篇2007
  • 2篇2006
7 条 记 录,以下是 1-7
排序方式:
一种基于“乐纹”的海量音乐检索系统
声音也可以有指纹(fingerprinting),它是音频对象的一种简短的概要,有时也称为robustsummaries,robustsignatures,perceptual hashes或robust hashes。...
徐英进王愈蔡锐蔡莲红
关键词:音乐检索
文献传递
基于HCSIPA的中英文混合语音合成被引量:4
2013年
基于双语说话人的中英文混合合成,提出一种中英文通用音标符号——HCSIPA,采用发音方式和部位为构造标准。在中英文混合聚类中,构造针对HCSIPA的中英文共用问题集,以提高中英文在决策树结构上的区分度。实验结果表明,HCSIPA能提高中文和英文的发音单元混合度,减少语言差距带来的音色差距,基于HCSIPA的混合合成系统可以合成较高质量的中英文语音,且中英文混合对单种语言合成的质量下降不明显。
徐英进蔡莲红
双语表现力语音合成与应用
吴志勇蔡莲红蒙美玲张申杨鸿武崔丹丹徐俊王永鑫宁辉黄嘉豪谢全辉贾珈孟凡博徐英进刘宇翔陶霖密袁春钟玉琢
该课题旨在进行汉语双语表现力合成语音的相关研究,并将其研究成果嵌入到多模态的口语对话系统中,从而进一步增进人机交互过程的和谐性,推动有表现力的可视语音合成技术的发展,为建立未来和谐人机语音交互环境提供理论基础和技术支持。...
关键词:
关键词:表现力可视语音合成
汉语语音合成中基于语境特征的清浊音时长调整
2012年
汉语语音合成中音节内清音和浊音的时长是影响合成语音自然度的重要因素。在HMM汉语语音合成中,提出了一种基于语境特征的清浊音时长调整算法。在算法中,首先对清音相对音节的时长根据语境特征进行决策树聚类。合成时,从该决策树得到对应音节的清音相对时长参考值,合成语音的清音和浊音时长按照参考值进行调整。试验表明该算法可以提高HMM汉语语音合成的时长预测准确度,有效地提高合成语音的自然度。
徐英进王永鑫蔡莲红
关键词:语音合成语境特征
多模态、多语种的语音、语言交互的研究与应用
蒙美玲蔡莲红吴志勇张申杨鸿武黄嘉豪崔丹丹曹光琦徐俊许佩瑜叶振兴贾珈王永鑫李煜智孟凡博卢伟杰徐英进陶霖密袁春钟玉琢刘宇翔
本项目属于计算机人机语言交互领域,针对多语种多模态言语交互,主要研究语言的分析与理解、表现力可视语音合成、口语对话等技术与应用。  主要科技内容如下:  1.建立了支持多语种统一的语言、语音处理框架,实现了自然语言处理与...
关键词:
关键词:多语种多模态
一种基于'乐纹'的海量音乐检索系统
声音也可以有指纹(fingerprinting),它是音频对象的一种简短的概要,有时也称为robust summaries, robust signatures,perceptual hashes或robust hash...
徐英进王愈蔡锐蔡莲红
关键词:音频检索版权管理数据库管理
文献传递
汉语语音合成中说话人自适应的时长优化被引量:1
2013年
在汉语语音合成中,音节内清音和浊音的时长是影响自然度的重要因素、并且与说话人关系较大的个性化特征之一。该文针对基于隐Markov模型(HMM)的汉语语音合成说话人自适应,提出了一种清浊音时长优化算法。将原始说话人训练语料的清音在音节中的相对时长特征根据语境特征进行决策树聚类,并进一步使用自适应算法将决策树中的特征值自适应到目标说话人的清音相对时长。在语音合成时,从该决策树得到目标说话人的清音相对时长参考值,合成语音的清浊音时长按照参考值进行调整。实验表明:该算法可以提高HMM汉语语音合成中说话人自适应的时长预测准确度,有效地提高说话人自适应的相似度和合成语音的自然度。
徐英进贾珈蔡莲红
关键词:汉语语音合成说话人自适应
共1页<1>
聚类工具0