国家留学基金(2006104705)
- 作品数:3 被引量:3H指数:1
- 相关作者:蔡骏沈映泉刘勇进史晓东黄关维更多>>
- 相关机构:厦门大学更多>>
- 发文基金:国家留学基金福建省自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 利用人类计算技术的语音语料库标注方法及其实现被引量:2
- 2009年
- 提出一种基于人类计算的语音语料库标注方法.该标注方法的主要思路是通过一个基于Web的语言学习系统来收集由大量学习者(用户)输入的词汇标注和音标标注,并从中选择出现概率最大的用户输入作为语料的正确标注.为了保证通过这种人类计算方法获得的标注文本的质量,使用了一些计算机辅助机制来校验收集到的标注的可靠性.采用这种方法实现语音语料库标注的主要优点在于将语料库标注和语言学习相结合,无需专门投入大量的人力来进行枯燥乏味的语料库标注工作,从而节省了语料库标注的成本.对这种基于人类计算的语音语料库标注技术进行了探讨,说明了用于收集用户输入的语言学习系统的设计以及标注生成系统的设计.系统的应用表明,该标注方法能够有效、低成本地生成语音语料库的词汇标注和音标标注.
- 沈映泉刘勇进蔡骏史晓东
- 一种用于说话人性别鉴定的混合算法被引量:1
- 2008年
- 提出一种用于语音识别的性别鉴定的算法,算法融合基音频率鉴定法和隐马尔可夫模型(HMM)鉴定法的混合算法。循环幅度差函数用于检测基音频率,HMM鉴定法建立男女两个HMM,用Viterbi算法将输入语音匹配到这两个模型,用匹配结果鉴定性别,基于这两种方法设计了一个线性分类器,在TIMIT、HTIMIT和南方口音语料库上采用1s长的语音片段进行测试,达到98.54%的正确率。将该算法应用于连续语音识别前端,较大提高了识别精度。
- 黄关维
- 关键词:性别鉴定基音检测隐马尔可夫模型连续语音识别
- 基于SIMD的似然率快速算法
- 2009年
- 分析基于连续概率密度的隐马尔可夫模型大词汇量连续语音识别系统中的似然率计算方法,阐述运用并行方式实现似然率计算的可行性,并在此基础上,提出一种基于SIMD的似然率快速算法,通过对语音识别工具包HTK3.4中似然率计算模块的改进实现该算法。实验结果表明,在不降低识别准确率的前提下,该算法能有效加快似然率计算的速度。
- 欧建林蔡骏林茜
- 关键词:SIMD技术隐马尔可夫模型语音识别