蔡骏
- 作品数:15 被引量:85H指数:5
- 供职机构:厦门大学信息科学与技术学院计算机科学系更多>>
- 发文基金:福建省自然科学基金国家自然科学基金国家留学基金更多>>
- 相关领域:自动化与计算机技术电子电信医药卫生理学更多>>
- 语音识别关键技术研究被引量:21
- 2006年
- 采用隐马尔可夫模型(HMM)进行语音声学建模是大词汇连续语音识别取得突破性进展最主要的原因之一,HMM本身依赖的某些不合理建模假设和不具有区分性的训练算法正在成为制约语音识别系统未来发展的瓶颈。神经网络依靠权能够进行长时间记忆和知识存储,但对于输入模式的瞬时响应的记忆能力比较差。采用混合HMM/ANN模型对HMM的一些不尽合理的建模假设和训练算法进行了革新。混合模型用神经网络非参数概率模型代替高斯混合器(GM)计算HMM的状态所需要的观测概率。另外对神经网络的结构进行了优化,取得了很好的效果。
- 息晓静林坤辉周昌乐蔡骏
- 关键词:HMMANNBP
- 连续语音快速识别的动态高斯分量选择算法
- 为了提高基于GMM的大词汇量连续语音识别系统的实时性能,在两种常用的似然率快速计算技术──基于VQ的高斯选择技术和部分距离消去算法(PDE)──的基础上提出了似然率快速计算的动态高斯选择算法(DGS)。DGS在似然率计算...
- 蔡骏黄关维LAPRIE YvesHATON Jean-Paul
- 关键词:语音识别连续语音
- 文献传递
- 大词汇量连续语音识别中的似然率快速算法及其应用
- 本文分析了基于多维混合高斯概率密度函数HMM的语音识别系统中似然率计算的时间开销,在此基础上论述了用于似然率快速计算的部分距离消去算法、最佳混合预测算法和特征矢量元素重排算法.实验结果表明,将这三种快速算法结合在一起加以...
- 蔡骏许海云胡益平史晓东
- 关键词:语音识别最大似然估计隐马尔可夫模型
- 文献传递
- 利用人类计算技术的语音语料库标注方法及其实现被引量:2
- 2009年
- 提出一种基于人类计算的语音语料库标注方法.该标注方法的主要思路是通过一个基于Web的语言学习系统来收集由大量学习者(用户)输入的词汇标注和音标标注,并从中选择出现概率最大的用户输入作为语料的正确标注.为了保证通过这种人类计算方法获得的标注文本的质量,使用了一些计算机辅助机制来校验收集到的标注的可靠性.采用这种方法实现语音语料库标注的主要优点在于将语料库标注和语言学习相结合,无需专门投入大量的人力来进行枯燥乏味的语料库标注工作,从而节省了语料库标注的成本.对这种基于人类计算的语音语料库标注技术进行了探讨,说明了用于收集用户输入的语言学习系统的设计以及标注生成系统的设计.系统的应用表明,该标注方法能够有效、低成本地生成语音语料库的词汇标注和音标标注.
- 沈映泉刘勇进蔡骏史晓东
- 自适应光学仿真建模在SciSimu上的扩展被引量:2
- 2009年
- 为了提高自主开发的组件建模与仿真平台SciSimu的自适应光学仿真和建模能力,将自适应光学系统码(CAOS)作为一个扩展添加到SciSimu。该文提出了一个使用接口库、自动管理和内置编译器实现扩展的设计原理。经过大量仿真项目的计算测试,证明该设计原理能让SciSimu具备自适应光学仿真能力,并且具有比CAOS更好的易用性和可扩展性。
- 林嘉文谢晓钢陶应学蔡骏
- 基于GMM的声音活动检测方法被引量:1
- 2009年
- 为了提高声音活动检测的鲁棒性,提出了一种基于GMM模型的声音活动检测方法。此方法在频谱特征空间中建立背景噪音和语音的GMM模型,然后采用模型匹配的方法对被测信号进行区分。此方法自适应更新GMM模型的参数,使之可以适应环境的变化。实验结果显示该方法在噪音环境中比传统的声音活动检测方法具有更高的准确率。
- 陈奇川蔡骏林茜
- 关键词:参数自适应语音识别
- 基于Speex语音引擎的VoIP系统设计与实现被引量:15
- 2007年
- 论述了一套基于Speex语音引擎和RTP的VoIP系统设计和开发,介绍了该系统服务器端和客户机端的软件实现。该系统具有点对点通信、算法延时小、丢包补偿和延时补偿性能好等特点,并具有多方通话功能。性能对比实验表明,该系统的通话质量优于几套流行的开源VoIP软件,能满足实际应用的要求。
- 谢晓钢蔡骏陈奇川欧建林
- 关键词:实时传输协议
- 基于GMM的实时说话人识别系统被引量:2
- 2007年
- 介绍了一个基于GMM实时说话人识别系统的设计与实现,系统具有实时说话人辨认和实时说话人确认功能。在实验室条件下,对不同的高斯混合密度个数及采样率进行了测试,测试了模型的自适应性能。实验表明系统具有较好的识别准确率。
- 胡益平蔡骏洪青阳
- 关键词:说话人识别实时系统高斯混合模型
- Fresnel层析成像并行算法研究被引量:2
- 2007年
- 与射线层析成像相比,Fresnel层析成像考虑波频率的影响,具有较高的分辨率,但所需的存储空间和计算量更大,因此提出了Fresnel层析成像的并行算法.把大型层析反演方程组的求解,转化成对其中的各个方程进行相互独立的计算,避免了大型系数矩阵的存储问题;把一个Fresnel带的正演和反演计算放在一个进程,不同Fresnel带的计算相互独立进行,不需要信息传递,达到了极高的并行度;从进程之间没有通信,仅当从进程计算结束后,在主进程与各从进程之间有少量的数据传递,使通信开销达到了极小的程度.应用MPI在LinuxPC集群环境下实现了该算法,实际测试表明,该算法具有较高的并行度和加速比.
- 张建中杨国辉林文蔡骏
- 关键词:层析成像旅行时间并行计算MPI
- 广播语料的语音/音乐自动分割方法研究
- 本文介绍了两种对广播语料进行语音和音乐分割的建模策略基于GMM的竞争建模策略和区别性建模策略──的实现,这两种策略的建模都采用了MFCC系数作为输入信号的特征参数。通过对实际新闻广播语料的测试,表明这两种策略都能建立起有...
- 崔文迪蔡骏黄关维
- 关键词:语音信号处理语音分割高斯模型
- 文献传递