您的位置: 专家智库 > >

李昊

作品数:10 被引量:12H指数:1
供职机构:中国科学院自动化研究所更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术电子电信语言文字天文地球更多>>

文献类型

  • 5篇会议论文
  • 4篇专利
  • 1篇期刊文章

领域

  • 6篇自动化与计算...
  • 3篇电子电信
  • 1篇天文地球
  • 1篇语言文字

主题

  • 6篇发音
  • 4篇语音
  • 4篇发音器官
  • 3篇人机
  • 2篇单音
  • 2篇单音节
  • 2篇动画
  • 2篇动画生成
  • 2篇动画制作
  • 2篇多通道
  • 2篇信号
  • 2篇音节
  • 2篇映射
  • 2篇语音合成
  • 2篇语音合成系统
  • 2篇语音信号
  • 2篇在线数据库
  • 2篇舌位
  • 2篇视频
  • 2篇数据库

机构

  • 10篇中国科学院自...

作者

  • 10篇陶建华
  • 10篇李昊
  • 9篇杨明浩
  • 5篇张大伟
  • 3篇刘斌
  • 2篇高廷丽
  • 1篇李雅

传媒

  • 1篇计算机科学
  • 1篇第十三届全国...
  • 1篇第十一届和谐...

年份

  • 1篇2017
  • 2篇2015
  • 4篇2014
  • 2篇2013
  • 1篇2012
10 条 记 录,以下是 1-10
排序方式:
人机对话中的意图及语音识别错误对交互体验的影响分析
自然人机对话中,由于环境噪声、方言口音等因素带来的语音识别错误以及语义分析的不充分等原因,计算机在理解用户交互意图时出现偏差,使得计算机对要反馈的话题出现错误,造成人机对话进程的断裂.本文以面向咖啡为主题的漫谈式人机对话...
扬明浩高廷丽陶建华张大伟孙梦伊李昊巢林林
关键词:人机对话语音识别
文献传递
基于X光的汉语单音节舌位轮廓运动数据库
尽管目前出现了很多面向发音器官病理诊治和观测的医学设备,X光图像序列作为一种有效的发音器官运动的观测手段,对于发音病理分析和嗓音诊治依然不可或缺。本研究建立了一个X光的汉语单音节女性的发音舌位运动轮廓数据库,该数据库包含...
杨明浩陶建华张大伟李昊
面向自然交互的多通道人机对话系统被引量:12
2014年
人们在对话过程中,除了使用口语交互外,还会很自然地利用表情、姿态等多模态信息辅助交流。重点分析并阐述了如何将这些多模态交互方式有效地融合到人机对话模型中,并实现一个面向自然交互的多模态人机对话系统。首先根据不同通道(如情感、头姿)对语音交互的影响,将它们主要分为信息互补、信息融合和信息独立3种模式,并针对3种模式分别采用不同的方式实现输入信息的多模态融合。信息融合后的对话管理,采用有限自动机、填槽法和混合主导方式的对话管理策略。针对对话中的情感处理,提出一种情感状态预测网络来记录用户的情感变化,并根据话语的轮转的不同对话上下文对用户情绪变化进行及时反馈,该对话模型能比较灵活地处理用户在对话过程中呈现的多模态信息。信息输出方面,针对人机对话中较为常用的数字虚拟人的行为控制,提出了一种简化的多模态协同置标语言,实现了虚拟人的包括情感、姿态与语音的同步表达,提高了虚拟人的表现力。最后基于以上关键技术,实现了一个面向城市路况信息查询的多模态自然人机对话系统。多个用户的体验表明,相对于传统的语音人机对话模型,多通道自然人机对话系统能有效提高用户交互的自然度。
杨明浩陶建华李昊巢林林
关键词:多模态信息融合人机交互对话管理
发音器官可视语音合成系统
本发明提供了一种发音器官可视语音合成系统,包括:音频分析模块、参数映射模块、动画驱动模块和运动分析模块,其中:音频分析模块,用于接收输入的说话人语音信号,根据能量信息判断静音段,将非静音段语音进行编码,输出语音线谱对参数...
陶建华杨明浩李昊刘斌
发音器官的网格动画生成方法
本发明提供了一种发音器官动画生成方法,包括:发音器官运动关键点的定义,各发音器官的中矢状面的二维网格的生成,发音器官纹理贴图,基于薄板样条的网格运动计算。本发明由发音器官运动关键点的位置,推算出发音器官中矢状面的形状,进...
陶建华杨明浩李昊
面向自然交互的多通道人机对话系统中答句自动生成方法研究
道自然人机对话系统要求计算机能对用户的语句产生智能应答,传统的人机对话系统由于知识库的限制以及用户话语的随意性,当对话内容超出知识库范围时系统将无法应答或产生与用户期望不符的回答,这在一定程度上影响了人机对话系统用户的体...
高廷丽陶建华杨明浩张大伟李昊巢林林车浩李雅刘斌
关键词:自然交互
语音驱动可视语音合成系统
语音驱动可视语音合成系统通过建立语音声学参数与发音器官轮廓运动参数之间的映射模型,实现人体发音过程中发音器官运动的可视化。首先构建了汉语电磁发声记录仪(EMA)数据库,提出了说话人无关的数据归一化算法、基于薄板样条逼近(...
张大伟李昊杨明浩陶建华
文献传递
发音器官可视语音合成系统
本发明提供了一种发音器官可视语音合成系统,包括:音频分析模块、参数映射模块、动画驱动模块和运动分析模块,其中:音频分析模块,用于接收输入的说话人语音信号,根据能量信息判断静音段,将非静音段语音进行编码,输出语音线谱对参数...
陶建华杨明浩李昊刘斌
文献传递
发音器官的网格动画生成方法
本发明提供了一种发音器官动画生成方法,包括:发音器官运动关键点的定义,各发音器官的中矢状面的二维网格的生成,发音器官纹理贴图,基于薄板样条的网格运动计算。本发明由发音器官运动关键点的位置,推算出发音器官中矢状面的形状,进...
陶建华杨明浩李昊
文献传递
基于X光的汉语单音节舌位轮廓运动数据库
尽管目前出现了很多面向发音器官病理诊治和观测的医学设备,X光图像序列作为一种有效的发音器官运动的观测手段,对于发音病理分析和嗓音诊治依然不可或缺。本研究建立了一个X光的汉语单音节女性的发音舌位运动轮廓数据库,该数据库包含...
杨明浩陶建华张大伟李昊
文献传递
共1页<1>
聚类工具0