张晖
- 作品数:5 被引量:11H指数:2
- 供职机构:内蒙古大学计算机学院更多>>
- 发文基金:国家自然科学基金内蒙古自治区科技计划项目更多>>
- 相关领域:自动化与计算机技术电子电信文化科学更多>>
- 基于词向量包的自动文摘方法被引量:5
- 2017年
- [目的]利用向量空间描述语义信息,研究基于词向量包的自动文摘方法;[方法]文摘是文献内容缩短的精确表达;而词向量包可以在同一个向量空间下表示词、短语、句子、段落和篇章,其空间距离用于反映语义相似度。提出一种基于词向量包的自动文摘方法,用词向量包的表示距离衡量句子与整篇文献的语义相似度,将与文献语义相似的句子抽取出来最终形成文摘;[结果]在DUC01数据集上,实验结果表明,该方法能够生成高质量的文摘,结果明显优于其它方法;[结论]实验证明该方法明显提升了自动文摘的性能。
- 白淑霞鲍玉来张晖
- 关键词:自动文摘
- 基于卷积神经网络的鲁棒性基音检测方法被引量:4
- 2016年
- 在语音信号中,基音是一个重要参数,且有重要用途.然而,检测噪声环境中语音的基音却是一项难度较大的工作.由于卷积神经网络(Convolutional neural network,CNN)具有平移不变性,能够很好地刻画语谱图中的谐波结构,因此我们提出使用CNN来完成这项工作.具体地,我们使用CNN来选取候选基音,再用动态规划方法 (Dynamic programming,DP)进行基音追踪,生成连续的基音轮廓.实验表明,与其他方法相比,本文的方法具有明显的性能优势,并且对新的说话人和噪声有很好的泛化性能,具有更好的鲁棒性.
- 张晖苏红张学良高光来
- 关键词:信号处理基音检测卷积神经网络动态规划
- 语音文本对齐技术构建蒙古语语音识别语料库研究
- 2024年
- 目前,适用于蒙古语的语音识别数据在规模上与英语、汉语的训练数据存在着巨大的差距。因此需要一种低成本的数据集构建方法,以补全数据来源上的短板。在生活交往中已生成了海量的蒙古语数据资源,其中很多都是语音文本粗略对照的形式,本研究采用从这样的语料中提炼可供训练用的语料的技术路线,选择电视剧配音剧本和对应成片作为样例,将提炼工作看作是一个语音文本对齐问题。通过一系列自动化处理将剧本和对应的音频转换为适用于语音文本对齐处理的数据形式,利用迭代的对齐方法得到了语音文本对齐结果,利用这些结果生成了适用于蒙古语语音识别的逐句对齐的“语音—文本对”数据。通过对生成的数据进行抽样检查发现,生成的数据有较好的质量,与人工标注基本一致,节省了数据生产的成本。
- 甄兆博张晖
- 关键词:语音识别蒙古语
- 基于细粒度韵律建模和条件CycleGAN的非平行蒙古语语音转换方法被引量:1
- 2021年
- 语音转换技术在保持语义内容不变的前提下将源说话人的语音音色转换为目标说话人。目前,蒙古语语音转换面临语料匮乏、蒙古语字词在发音上韵律变化丰富等问题。针对这些问题,本文提出一种基于细粒度韵律建模和条件CycleGAN的非平行蒙古语语音转换方法。该方法首先使用连续小波变换提取细粒度的语音韵律特征,然后向CycleGAN中加入说话人向量构建条件CycleGAN,最后使用条件CycleGAN得到源说话人和目标说话人之间稳定的韵律转换。实验结果表明,该方法与传统CycleGAN语音转换方法相比能够有效提升蒙古语语音转换效果,在语音自然度和说话人相似度的MOS评分上分别提升了0.1和0.2。
- 吴则诚飞龙张晖王海波
- 基于深度学习的蒙古语AI合成主播被引量:1
- 2023年
- 目前,汉文AI合成主播已被运用于新闻内容生产和传播,为传统新闻媒体行业开辟了新的发展路径,但蒙古语AI合成主播技术的研究仍处于起步阶段。为了研发蒙古语AI合成主播系统,本文采用深度学习技术提出了基于嘴型分类的蒙古语AI合成主播模型。首先采用ObamaNet模型构建了蒙古语AI合成主播基线系统,因为基线系统的时间开销大,提出了基于嘴型分类的蒙古语AI合成主播模型,此方法使用9种嘴型标签代表所有的嘴型状态,将得到的语音特征同步到不同的嘴型,根据得到的嘴型选择候选帧,得到AI主播合成视频。文章构建了蒙古语AI合成主播视频语料库,并以此为基础进行了实验比较。结果表明,文中提出的模型可以生成自然度较好的蒙古语AI合成主播视频。
- 宝音都古楞飞龙王炜华张晖张晖
- 关键词:蒙古语