国家自然科学基金(69975018)
- 作品数:9 被引量:57H指数:4
- 相关作者:王仁华胡国平王煦法胡郁张巍更多>>
- 相关机构:中国科学技术大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信语言文字更多>>
- 基于DSP的嵌入式汉语文语转换系统及其VLSI设计方案
- 2003年
- 简要讨论了嵌入式文语转换(ETTS)系统的概念。介绍了一个基于DSP实时实现的嵌入式汉语文语转换(ECTTS)系统。基于DSP实现的结果,分析了ECTTS系统的VLSI实现方案,提出了基于动态内存管理的ECTTS系统前端处理VLSI实现方案,基于解码语音帧的ECTTS系统后端合成VLSI实现框架并对ECTTS系统的VLSI实现中的存储器及总线结构进行了讨论。
- 戴礼荣王仁华
- 关键词:DSPVLSI数字信号处理器
- 粤语语音合成系统语料库设计研究被引量:5
- 2005年
- 介绍了语料库设计的原理和过程,并结合粤语语音合成系统语料库实现,提出了“语境矢量”的独特设计和“语境总量”的概念,给出了语境总量的计算方法。最后介绍了Greedy算法,并给出了文本语料搜索的具体流程。
- 徐英莹张培仁
- 关键词:语音合成语料库
- 基于双层决策的新闻网页正文精确抽取被引量:25
- 2006年
- 本文提出了基于双层决策的新闻网页正文的精确抽取算法,双层决策是指对新闻网页正文所在区域的全局范围决策和对正文范围内每段文字是否确是正文的局部内容决策。首先根据实际应用的需要给出了新闻网页正文的严格界定,然后分析了新闻网页及其正文的特性,提出了基于双层决策的正文抽取策略,基于特征向量提取和决策树学习算法对上述双层决策进行了建模,并在国内10个主要新闻网站的1687个新闻页面上开展了模型训练和测试实验。实验结果表明,上述基于双层决策的方法能够精确地抽取出新闻网页的正文,最终正文抽取与人工标注不完全一致的网页比例仅为18.14%,比单纯局部正文内容决策的方法相对下降了29.85%,同时抽取误差率大于10%的网页比例更是仅为7.11%,满足了实际应用的需要。
- 胡国平张巍王仁华
- 关键词:计算机应用中文信息处理信息抽取决策树正文抽取
- 基于整句相似性计算的韵律短语预测模型被引量:2
- 2006年
- 语音合成系统中,韵律短语的预测对合成语音的自然度有重要影响.为了突破主流的基于决策树预测方法的若干缺陷,提出了基于整句相似性计算的韵律短语预测模型.通过对1000个句子的测试,该方法在可接受的语料手工标注工作量的范围内,超过了传统决策树的方法.
- 李剑锋胡国平王仁华
- 基于决策树的汉语大语料库合成系统
- 文中提出了一种利用决策树技术进行韵律预测和基频连接特征分析的大语料库合成系统.针对大语料库合成系统中信息含量大,分析情况复杂的特点,利用基于决策树的机器学习技术,进行了基频曲线和时长信息以及在不同音节的结合处基频点变化情...
- 王仁华胡郁李威凌震华
- 关键词:决策树韵律模型
- 文献传递
- 一种基于区分性准则的模型结构优化方法被引量:1
- 2008年
- 本文提出了一种基于区分性准则的模型结构优化方法,用以调整HMM自动语音识别系统中声学模型各状态混合高斯核成分数量的分配。通过优化选定的准则,声学模型可以在使用相同参数数量的情况下得到更好的识别性能,也可以在保持相当性能的前提下降低所需要的模型参数。相对于传统的基于似然度及复杂度惩罚的模型结构优化准则来讲,基于区分性准则的优化方法能够更直接地提高模型的区分度和鉴别力,从而得到更好的识别效果。在一个面向嵌入式系统的中文连续数字串识别任务上的实验结果证明,基于最大互信息量准则的模型结构优化能够得到比传统的、基于模型似然度及复杂度的方法更好的识别效果。
- 鄢志杰胡郁王仁华
- 关键词:计算机应用中文信息处理自动语音识别声学模型
- 一种基于Straight的语音焦点合成方法被引量:4
- 2005年
- 针对汉语焦点的特性,设计了接近自然语流风格的实验语料。通过对语料的分析,运用CART技术,建立了焦点的韵律模型。在语音合成阶段,使用韵律模型生成语音的韵律参数,结合Straight算法,实现了语音焦点的合成。对合成效果的评测表明,该方法能够合成自然度很高的语音焦点。
- 杨金辉易中华王煦法
- 关键词:分类回归树STRAIGHT语音合成
- 词性相似度的研究及其在轻重音检测模型中的应用
- 2004年
- 采用统计学方法,分析、建立了不同词性在韵律参数上的二维相似度表格,并将此结果直接应用到基于CART和基于贝叶斯的重音检测模型中。
- 王建王煦法胡郁
- 关键词:CART贝叶斯统计分析语音识别
- 中文语音合成系统中的语料库设计
- 音库的制作是基于大语料库中文合成系统的一个重要的方面,而音库的制作要以一定的语料作为基础.当前,在设计基于大语料库的合成系统中,寻找合适的语料已经成为决定合成系统性能的一个关键因素,因此越来越受到研究者的重视.这篇论文详...
- 孙岭胡郁王仁华
- 文献传递
- 中文语音合成系统中的文本标准化方法被引量:12
- 2003年
- 文本标准化是对输入文本进行分析 ,生成其中非汉字符号的拼音、节奏等信息的过程。本文提出了一种层次化的、基于外部规则的标准化方法 ,通过规则匹配识别这些符号 ,并给出各种正确信息。本文首先介绍了分析树的概念 ,其次给出构造规则的步骤 ,利用权值控制规则的匹配顺序 ,最后给出实验结果。实验结果表明 :这种方法具有很好的易维护性和可扩展性 ,开放测试的正确率达到 99 76 %。
- 陈志刚胡国平王熙法
- 关键词:文语转换系统