朱云
- 作品数:6 被引量:2H指数:1
- 供职机构:中国科学院深圳先进技术研究院更多>>
- 发文基金:中国科学院知识创新工程国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于发音轨迹的可视语音合成被引量:1
- 2013年
- 着眼于语音可视化。为呈现真实说话人各发音器官的运动,提出一种改进的CM协同发音模型,并采用该方法合成汉字的发音轨迹,进而以此驱动和控制虚拟3D音视频说话人头模型,直观呈现通常可见及不可见发音器官的发音运动。实验证明:由改进方法获得的合成发音轨迹更逼近真实发音轨迹。同时,为了定量比较舌读和唇读在语音感知和识别中的作用,设计三组感知实验,实验结果显示:叠加了唇读信息的感知识别率较单纯的加噪语音的识别率提高了25.8%;而叠加了舌读信息的识别率较单纯听觉信息的识别率提高了26.7%。因此,当语音恶化时,舌读信息可提供大于唇读信息的补充作用,且舌读信息与唇读信息一样具有识别力。
- 郑红娜白静王岚朱云
- 关键词:唇读
- 一种电子病历生成方法和电子病历系统
- 本发明公开了一种电子病历生成方法和电子病历系统,其中,电子病历生成方法包括:终端在接收到指示创建电子病历的指令时采集录入的语音;终端提取本次录入的语音的声音特征,生成声音特征文件;终端将声音特征文件发送给服务器;服务器接...
- 宋弘扬朱云陈龙王岚
- 文献传递
- 一种生成说话人三维运动模型的方法、系统及计算机
- 本发明适用于三维可视化技术领域,提供了一种生成说话人三维运动模型的方法包括:获取摄像头采集的彩色图像的信息以及深度数据信息;将获取到的数据送入人脸检测函数,计算是否检测到人脸,如果检测到人脸,则计算当前人脸的状态;根据计...
- 朱云王岚陈辉
- 文献传递
- 汉语三维发音动作合成和动态模拟被引量:1
- 2013年
- 本文以帮助聋儿言语康复为出发点,从聋儿音频发音数据中获得了聋儿易错发音文本以及聋儿易混淆发音文本对。设计了一个数据驱动的3D说话人头发音系统,该系统以EMA AG500设备采集的发音动作为驱动数据,逼真模拟了汉语的发音,从而可使聋儿观察到说话人嘴唇及舌头的运动情况,辅助聋儿发音训练,纠正易错发音。最后对系统的性能进行了人工评测,结果表明:3D说话人头发音系统可以有效地模拟说话人发音时口腔内外器官的发音动作。此外,本文还用基于音素的CM协同发音模型合成的方法,合成了聋儿易错发音文本的发音动动作,并用RMS度量了合成发音动作与真实发音动作的误差,得到了均值为1.25mm的RMS误差值。
- 郑红娜朱云王岚陈辉
- 关键词:DIRICHLET
- 一种电子病历生成方法和电子病历系统
- 本发明公开了一种电子病历生成方法和电子病历系统,其中,电子病历生成方法包括:终端在接收到指示创建电子病历的指令时采集录入的语音;终端提取本次录入的语音的声音特征,生成声音特征文件;终端将声音特征文件发送给服务器;服务器接...
- 宋弘扬朱云陈龙王岚
- 文献传递
- 一种生成说话人三维运动模型的方法、系统及计算机
- 本发明适用于三维可视化技术领域,提供了一种生成说话人三维运动模型的方法包括:获取摄像头采集的彩色图像的信息以及深度数据信息;将获取到的数据送入人脸检测函数,计算是否检测到人脸,如果检测到人脸,则计算当前人脸的状态;根据计...
- 朱云王岚陈辉
- 文献传递