付跃文
- 作品数:11 被引量:50H指数:2
- 供职机构:南京工业大学电子与信息工程学院更多>>
- 发文基金:国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信文化科学更多>>
- 关于嵌入式系统教学的几点思考被引量:37
- 2006年
- 根据嵌入式系统的特点和理工科院校人才培养的特点,讨论了嵌入式系统教学、实验内容、模式以及课程体系的建设等问题,并就如何开展嵌入式系统教学、人才培养提出了建议。
- 仲伟波包亚萍付跃文李义丰
- 关键词:嵌入式系统实验教学
- 高性能的多体印刷英文识别系统的实现被引量:3
- 2006年
- 提高低质量文本图像的识别率是现今文字识别研究的重要方向。文章对倾斜文本行的切分算法,断裂、粘连、交叠字符的切分算法以及后处理作了较为深入的研究,提出一些新的算法。该系统能够识别多达260种字体,包括黑体、斜体等字体,对训练集的识别率达到98.5%,并在实际应用中取得了良好效果。
- 陈国平张明新付跃文王劲林
- 关键词:光学字符识别字符切分后处理
- 口语对话语音识别解码策略与置信度研究
- 口语对话系统的语音识别是语音识别领域近年来的研究重点之一,本文的研究工作的总的目的是建立实用的针对口语对话系统的语音识别解码平台.在本文中,口语对话系统解码器的两个重要的要求——解码的实时性和对于识别结果的置信度的估计,...
- 付跃文
- 关键词:语音识别搜索算法置信度决策树
- 文献传递
- 基于混合激励的高质量语音合成声源模型
- 在基于LPC的语音合成系统中,采用混合激励声源模型可以提高合成语音的自然度,但传统混合激励模型的线性相位假设与实际语音不符,因而合成语音的自然度还不够理想。本文提出了一种新的脉冲形状滤波器系数提取算法,该算法利用浊音余量...
- 陈国平付跃文张明新张东滨王劲林
- 关键词:语音合成
- 文献传递
- 基于Word Lattice结构的语音识别置信度算法被引量:2
- 2006年
- wordlattice是与词图(wordgraph)结构类似但是结构没有词图致密的在小任务语音识别的情况下较为常见的一种中间输出结构,给出了在wordlattice结构上的语音识别置信度估计的一种算法。以lattice结构中的连接弧作为计算单元,给出了利用前后向算法高效计算lattice中每个弧的词后验概率及以其为基础计算每个词的置信度的算法。
- 付跃文陈国平刘浩杰
- 关键词:语音识别置信度WORDGRAPH
- 语音识别错误的分类分析被引量:1
- 2005年
- 大词表连续语音识别系统由多个组件构成,识别错误受多种因素的影响。系统开发者需要分析错误发生的不同原因。根据语音识别的基本理论给出了对错误进行分类分析的原理,将识别错误按错误原因分为解码错误、声学模型错误、语言模型错误、声学和语言复合错误四大类,并对分类后的错误做了统计分析。实验证明,识别错误的分类分析为系统的改进提供了参考依据。
- 付跃文杜利民
- 基于混合激励的高质量语音合成声源模型
- 在基于LPC的语音合成系统中,采用混合激励声源模型可以提高合成语音的自然度,但传统混合激励模型的线性相位假设与实际语音不符,因而合成语音的自然度还不够理想。 本文提出了一种新的脉冲形状滤波器系数提取算法,该算法利用...
- 陈国平付跃文张明新张东滨王劲林
- 关键词:语音合成
- 文献传递
- 基于MBIC的决策树聚类算法在连续语音识别中的应用被引量:2
- 2005年
- 提出了一种采用最小贝叶斯信息准则(MinimumBayesianInformationCriterion,MBIC)来最优化控制决策树结点分裂程度的算法。首先在理论上证明了MBIC能够较好地解决模型参数复杂度与训练数据集规模之间的权衡问题,然后给出了基于MBIC的决策树分裂停止准则的计算公式。汉语连续语音全音节识别实验表明:与传统的最大似然准则(MaximumLikeihoodCriterion,MLC)相比,MBIC对声学模型参数和训练数据集的变化具有更好的适应能力。
- 陈国平杜利民付跃文王劲林
- 关键词:连续语音识别
- 韵律块基频曲线的优化及规则被引量:2
- 2007年
- 汉语规则合成系统中,连续语流基频曲线(F0曲线)的生成并不是各个合成单元F0曲线的简单拼接,而是语音学功能单元的综合作用。该文提出了汉语韵律块基频曲线优化的正演思想,使韵律块内的基频曲线融入重音强度、形状失真度以及发音速度等语境和发音的个体信息,提高合成语音的自然度。基于这种优化思想,该文针对聚类后的单音节、二音节和三音节韵律块的基频曲线,利用最小均方误差准则通过反演提取了各个单元的优化相关参数(高音线、低音线、平滑因子、形状失真度、重音强度)。对音节在韵律块中的位置因素和声调因素对优化相关参数的影响的统计分析表明了参数提取结果的可靠性和基频曲线优化的合理性,得到了优化控制参数在规则合成系统中具体的应用规则。实际的听测实验表明,韵律块基频曲线进行优化前后,合成系统的清晰度分别为3.25和3.35,自然度分别为2.9和3.31。
- 刘浩杰杜利民付跃文
- 基于多词汇树的对话语音识别搜索策略
- 2007年
- 在查询类对话语音识别系统中,词汇中的少数几类词往往占有词汇量的很大部分,利用这一重要特点,可以对传统的基于单树结构的搜索算法进行改进。本文在采用基于类的语言模型的条件下,在查询类对话语音识别系统中,对词汇中的若干大类单独建树,从而免除了多数词汇的语言模型look-ahead计算时间和存储空间,并实现了语言分的提前精确运用。针对机票预订口语对话系统的实验表明,该搜索策略与单树方法相比,在同样的计算资源条件下,时间效率有显著提高。
- 付跃文仲伟波
- 关键词:语音识别搜索