严乐贫
- 作品数:3 被引量:9H指数:2
- 供职机构:华南理工大学电子与信息学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 双模态车载语音控制仿真系统的设计与实现被引量:2
- 2010年
- 针对音、视频双模态语音识别能有效地提高噪声环境下的识别率的特性,本文设计了车载语音控制指令识别实验系统。该系统模拟车载环境,把说话时的视频信息融入到语音识别系统中,系统分为模型训练、离线识别和在线识别3部分。在线识别全程采用语音作为人机交互手段,并具备用户自适应的功能。离线识别部分将系统产生的数据分层次进行统计,非常适合进行双模态语音识别算法研究。
- 严乐贫奉小慧
- 关键词:语音识别
- 基于PS-Level Set的嘴唇几何形状定位模型被引量:8
- 2010年
- 针对面向唇读的水平集模型在嘴唇分割中存在边界过收敛和过早收敛的问题,文中提出了一种改进的基于先验知识的水平集模型(简称为PS-Level Set)来进行嘴唇几何形状的定位.PS-Level Set模型利用改进的差值能量函数引入嘴唇形状的先验信息.在曲线演化过程中,反复比较演化曲线和先验曲线的差距,使曲线的演化形状逐渐逼近先验模型形状,从而更精确地收敛于目标物体实际轮廓.实验表明,用PS-Level Set模型定位嘴唇几何形状的准确率比用水平集模型提高了8.38%.
- 奉小慧贺前华王伟凝严乐贫
- 关键词:唇读水平集模型
- 音视频双模态车载语音控制系统的设计与实现
- 语音控制应用于行车环境有助于解放驾驶员的双手和双眼,提高驾驶安全和驾驶乐趣。目前噪声环境下单独依靠音频信息所得到的识别率很低,制约了车载语音控制的发展。利用视觉信息辅助语音识别能提高噪声环境下语音识别系统的识别率。行车过...
- 严乐贫
- 关键词:HTK仿真系统
- 文献传递