韩兆兵
- 作品数:10 被引量:6H指数:1
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术语言文字更多>>
- 电话语音翻译中的语音识别研究
- 近年来随着网络技术和语音技术的发展,电话语音翻译成为一个研究方向.语音识别是实现电话语音翻译的关键环节.不同于以往的语音识别,电话语音识别必需克服复杂的网络传输环境对话音质量的影响.本文介绍我们在汉语电话语音识别领域的一...
- 张化云韩兆兵徐波
- 文献传递
- 电话语音识别中基于统计模型的动态通道
- 2004年
- 与桌面环境相比,电话网络环境下的语音识别率仍然还比较低,为了推动电话语音识别在实际中的应用,提高其识别率成了当务之急,先前的研究表明,电话语音识别率明显下降通常是因为测试和训练环境的电话通道不同引起数据失配造成的,因此该文提出基于统计模型的动态通道补偿算法(SMDC)减少它们之间的差异,采用贝叶斯估计算法动态地跟踪电话通道的时变特性。实验结果表明,大词汇量连续语音识别的字误识率(CER)相对降低约27%,孤立词的词误识率(WER)相对降低约30%。同时,算法的结构时延和计算复杂度也比较小,平均时延约200 ms,可以很好地嵌入到实际电话语音识别应用中。
- 韩兆兵张化云张树武徐波
- 关键词:电话语音识别最大似然估计最大后验估计
- 电话语音识别技术研究
- 电话是最普及的话音通信工具,是各种先进语音技术最大的潜在应用领域。语音识别是基于电话平台的语音应用的一项核心技术。大词汇量连续语音识别技术(LVCSR)在最近十几年取得长足的发展,但当LVCSR系统从基于高质量麦克风的桌...
- 韩兆兵
- 关键词:语音识别马尔可夫模型声学建模
- 文献传递
- 基于三元统计模型的汉语分词及标注一体化研究
- 汉语的分词及词性标注是汉语语言处理的基础.虽然,该领域在过去十年已经有了很大进展,但高精度的面向大规模真实文本的分词及标注仍然存在许多困难.本文提出一种基于三元统计模型的汉语分词标注的方法,旨在并行考虑词性及词汇的三元概...
- 高山张艳徐波宗成庆韩兆兵
- 关键词:分词词性标注
- 基于先验知识和目标驱动的GJMAP自适应算法
- 说话人自适应是提高非特定人语音识别性能的有效技术.本文提出基于先验知识和目标驱动的GJMAP自适应技术,改进和泛化了JMAP算法,较好的控制先验模型和自适应数据间的比例.另外,关于回归树的定义采用先验语音学知识引导下的目...
- 韩兆兵张化云张树武徐波
- 关键词:语音识别自适应算法先验知识
- 文献传递
- 电话语音翻译中的语音识别研究
- 张化云韩兆兵徐波
- 基于先验知识和目标驱动的GJMAP自适应算法
- 说话人自适应是提高非特定人语音识别性能的有效技术。本文提出基于先验知识和目标驱动的GJMAP自适应技术,改进和泛化了JMAP算法,较好的控制先验模型和自适应数据间的比例。另外,关于回归树的定义采用先验语音学知识引导下的目...
- 韩兆兵张化云张树武徐波
- 文献传递
- 语音服务器中的语音识别技术
- 近年来随着网络技术和语音技术的快速发展,网络语音翻译成为一个研究方向.语音识别是实现语音翻译的关键环节.与以往的语音识别技术不同,这里应用的电话语音识别技术必需克服复杂的网络传输通道对话音质量的影响.本文介绍我们在这方面...
- 张化云韩兆兵徐波
- 关键词:语音识别特征提取声学模型语言模型
- 文献传递
- C-STARⅢ中文系统平台建设
- 随着国际间合作研究的拓广和发展,中国科学院模式识别国家重点实验室成为“国际电话语音翻译研究”(C-STAR)的第七个核心成员国.电话语音同声翻译涉及的主要研究领域包括语音识别、自然语言翻译、语音合成和CTI.本文介绍本实...
- 韩兆兵徐波
- 关键词:语音识别语音合成同声翻译
- 文献传递
- 连续语音识别中声学建模的组合聚类算法研究被引量:6
- 2003年
- 基于三音子连续语音识别的一个关键问题是在有限训练数据的条件下对大量声学模型参数的鲁棒性估计。为了解决这个问题 ,有两个主要的上下文相关的聚类算法被提出 ,它们是合并 (AgglomerativeClustering)聚类 (AGG)和决策树 (Tree based)聚类 (TB)。本文分析了这两种算法的优缺点 ,并分别对其进行了改进 ,然后提出了最大似然框架下组合聚类算法。大词汇量连续语音识别 (LVCSR)的实验结果表明 ,和单一的决策树聚类算法比较 ,提出的组合聚类算法对识别率有显著的提高。
- 韩兆兵贾磊张树武徐波
- 关键词:连续语音识别声学建模