您的位置: 专家智库 > >

陶建华

作品数:426 被引量:366H指数:12
供职机构:清华大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金更多>>
相关领域:自动化与计算机技术电子电信语言文字文化科学更多>>

文献类型

  • 303篇专利
  • 59篇期刊文章
  • 58篇会议论文
  • 3篇科技成果
  • 1篇学位论文

领域

  • 112篇自动化与计算...
  • 80篇电子电信
  • 21篇语言文字
  • 18篇文化科学
  • 1篇天文地球
  • 1篇交通运输工程
  • 1篇理学

主题

  • 211篇语音
  • 66篇语音合成
  • 45篇音频
  • 44篇声学特征
  • 40篇文本
  • 36篇存储介质
  • 32篇情感
  • 29篇语音识别
  • 29篇视频
  • 29篇情感识别
  • 27篇电子设备
  • 27篇网络
  • 27篇向量
  • 26篇神经网
  • 26篇神经网络
  • 22篇信号
  • 21篇解码
  • 20篇多模态
  • 20篇语音检测
  • 18篇音频特征

机构

  • 356篇中国科学院自...
  • 71篇清华大学
  • 10篇中国科学院大...
  • 8篇国家计算机网...
  • 6篇北京师范大学
  • 5篇中国科学院
  • 4篇湖南师范大学
  • 4篇西北师范大学
  • 3篇北京科技大学
  • 3篇湖南财政经济...
  • 3篇中国科学院脑...
  • 2篇浙江大学
  • 2篇中国社会科学...
  • 1篇安徽大学
  • 1篇北京语言大学
  • 1篇哈尔滨理工大...
  • 1篇国防科学技术...
  • 1篇南京大学
  • 1篇北京理工大学
  • 1篇山东大学

作者

  • 424篇陶建华
  • 105篇易江燕
  • 65篇刘斌
  • 37篇张大伟
  • 36篇李雅
  • 33篇温正棋
  • 25篇杨明浩
  • 22篇蔡莲红
  • 16篇梁山
  • 11篇汪涛
  • 10篇张帅
  • 10篇康永国
  • 10篇于剑
  • 9篇李昊
  • 7篇吴志勇
  • 7篇黄力行
  • 7篇王志明
  • 7篇董宏辉
  • 7篇潘诗锋
  • 6篇戚肖克

传媒

  • 11篇清华大学学报...
  • 7篇中文信息学报
  • 5篇信号处理
  • 4篇声学学报
  • 4篇计算机研究与...
  • 4篇第九届全国人...
  • 3篇计算机辅助设...
  • 3篇计算机科学
  • 3篇CTI世界(...
  • 3篇第九届全国人...
  • 2篇微电脑世界
  • 2篇小型微型计算...
  • 2篇信息安全学报
  • 2篇第十三届全国...
  • 1篇自动化学报
  • 1篇计算机应用
  • 1篇软件学报
  • 1篇计算机工程与...
  • 1篇系统仿真学报
  • 1篇紫光阁

年份

  • 52篇2024
  • 27篇2023
  • 49篇2022
  • 101篇2021
  • 11篇2020
  • 9篇2019
  • 17篇2018
  • 13篇2017
  • 7篇2016
  • 6篇2015
  • 13篇2014
  • 7篇2013
  • 7篇2012
  • 18篇2011
  • 6篇2010
  • 6篇2009
  • 7篇2008
  • 15篇2007
  • 8篇2006
  • 8篇2005
426 条 记 录,以下是 1-10
排序方式:
一种精神状态分析系统、电子设备及存储介质
本发明提供一种精神状态分析系统、电子设备及存储介质,其中,系统包括:多模态特征提取模块、跨模态注意力模块和精神状态检测模块;所述多模态特征提取模块将长音视频转换为图像序列和语音片段,并且提取面部特征和音频特征;将所述面部...
陶建华
基于Transformer的标记选择和合并的表情识别方法及系统
本发明提供基于Transformer的标记选择和合并的表情识别方法及系统,包括:将图像分割成不重叠的斑块,并通过线性投影映射到一个D维度的特征向量,构成标记嵌入向量;将其输入第一Transformer网络,得到标记特征;...
雷震杨阳陶建华翁敦芳
文献传递
采用重音调整模型的HMM语音合成系统
韵律模型一直是语音合成中的研究重点,而重音则是目前韵律研究中的主要难点。在已有的研究工作中重音的定性分析较多,但重音生成则相对较少。该文采用基于重音调整的方法,构建了一个支持重音的隐Markov模型(hiddenMark...
李雅潘诗锋陶建华
关键词:重音语音合成韵律
文献传递
一种高效的语音检测方法
本发明公开了一种语音检测方法,该方法包括以下步骤:在时域上分析原始音频的短时能量和短时过零率,剔除其中的部分非语音信号;在频域上分析保留下来的音频信号子带的谱包络特性和子带的熵特性,进一步剔除其中的部分非语音信号;将保留...
陶建华刘斌
文献传递
基于后解码可信增强的大模型知识补全方法及系统
本发明提供了一种基于后解码可信增强的大模型知识补全方法及系统,涉及知识补全技术领域。本发明实施例中,针对目标知识领域,在大模型输出答案之前,使用后解码模块来对大模型的输出的隐层状态进行后解码处理,基于目标知识领域相对应的...
陶建华车飞虎张帅
基于预训练语言模型的语音生成方法、装置、设备及介质
本发明实施例涉及一种基于预训练语言模型的语音生成方法、装置、设备及介质,属于语音合成领域,通过基于第一预训练语言模型对待生成语音的目标文本进行编码,获得语义令牌序列;基于第二预训练语言模型对基于自然语言描述的语音风格控制...
陶建华任勇易江燕汪涛
基于稀疏滑动窗口的低时延生成音频检测连续学习方法、装置、设备及介质
本发明提供了一种基于稀疏滑动窗口的低时延生成音频检测连续学习方法、装置、设备及介质,具体涉及音频检测技术领域,本发明实施例中,在对音频检测源模型进行训练的过程中,使用滑动池化窗口将模型第m层输出的隐藏状态分解为多个中间编...
陶建华
基于音节韵律约束关系的汉语语音合成方法及系统
本发明公开了一种基于音节韵律约束关系的汉语语音合成方法及系统,系统包括:文本输入模块、韵律处理模块、语音输出模块。方法包括:接收或输入任意文字串转换成语音输出;文本分析对输入文本格式和内容分析并转换成音节序列串;韵律预测...
陶建华于剑
文献传递
拼接语音合成系统中的韵律自适应研究
本文提出了一种新的、基于拼接语音合成系统的韵律自适应模型。该模型能够利用目标说话人少量的语料使语音合成系统合成具有目标说话人韵律特征的语音。同基于平行语料的韵律转换方法相比,本文所提出的韵律自适应模型与语音合成的韵律生成...
贾惠彬陶建华于剑
关键词:语音合成
文献传递
特征提取模型的训练方法和融合发音特征的语音鉴别方法
本发明涉及计算机技术领域,具体而言涉及一种特征提取模型的训练方法和融合发音特征的语音鉴别方法,其中特征提取模型的训练方法包括:获取训练样本;根据训练样本对特征提取模型进行训练,生成训练数据;将训练数据分别输入到至少两个解...
陶建华王成龙易江燕
共43页<12345678910>
聚类工具0