您的位置: 专家智库 > >

王炜华

作品数:4 被引量:8H指数:2
供职机构:内蒙古大学计算机学院更多>>
发文基金:国家自然科学基金内蒙古自治区自然科学基金内蒙古自治区科技计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 2篇蒙古语
  • 1篇信息检索
  • 1篇信息检索系统
  • 1篇语言模型
  • 1篇主播
  • 1篇网络
  • 1篇蒙古文
  • 1篇结尾
  • 1篇跨语言检索
  • 1篇跨语言信息检...
  • 1篇后缀
  • 1篇混淆网络
  • 1篇古文
  • 1篇关键词检测
  • 1篇AI
  • 1篇词干

机构

  • 4篇内蒙古大学

作者

  • 4篇王炜华
  • 1篇张晖
  • 1篇闫学亮
  • 1篇高光来
  • 1篇鲍玉来
  • 1篇白淑霞

传媒

  • 2篇中央民族大学...
  • 1篇情报理论与实...
  • 1篇计算机科学

年份

  • 1篇2024
  • 1篇2023
  • 1篇2017
  • 1篇2013
4 条 记 录,以下是 1-4
排序方式:
基于分割识别的蒙古语语音关键词检测方法的研究被引量:2
2013年
蒙古文属于黏着语,词根和后缀能够组合成近百万的蒙古文单词。现有的蒙古语大词汇量连续语音识别(LVCSR)系统的发音词典无法包含所有蒙古文单词。同时发音词典较大时,训练语料的稀疏将导致LVCSR系统的性能明显下降。为了解决LVCSR系统中大多数蒙古文单词的识别问题和蒙古语语音关键词检测系统中大量集外词的检测问题,结合蒙古文的构词特点,提出了基于分割识别的蒙古语LVCSR方法,并建立了对应的声学模型和语言模型。最后,将此方法应用到了蒙古语语音关键词检测系统中并在蒙古语语音语料上进行了测试。实验结果表明,基于分割识别的蒙古语LVCSR方法能解决大部分蒙古文单词的识别问题,并将蒙古语语音关键词检测系统的大量集外词转化成了集内词,大幅度提高了检测系统的查准率和召回率。
飞龙高光来闫学亮王炜华
关键词:蒙古语词干关键词检测混淆网络
汉蒙跨语言检索系统设计与实现被引量:5
2017年
[目的/意义]基于汉蒙间跨语言检索系统发展现状,设计并实现通过汉文、传统蒙古文关键词检索西里尔蒙古文文档的系统。[方法/过程]汉蒙跨语言检索系统包括机器翻译和文档检索。在机器翻译方面,实现了基于词典的汉文到西里尔蒙古文机器翻译,并实现了基于规则和统计的传统蒙古文到西里尔蒙古文转换;在文档检索方面,基于Lucene全文索引工具包对大量的西里尔蒙古文文档建立索引,并根据向量空间模型对查询和文档的相似度进行排序,得到与查询最为匹配的文档集。[结果/结论]本系统响应速度较快,准确率较高,达到可用水平。一方面促进中国与蒙古国之间的科技、文化、教育的交流;另一方面对我国西里尔蒙古文的研究有一定的促进作用。
鲍玉来白淑霞飞龙王炜华
关键词:跨语言信息检索信息检索系统
融入黏着语特征的蒙古文预训练语言模型
2024年
预训练语言模型(PLM)在自然语言处理(NLP)任务上应用广泛且表现优异。目前预训练语言模型主要在英语和中文等资源丰富的语言上进行训练,由于缺乏大规模的数据资源及语言特征的复杂性,导致预训练语言模型尚未在低资源语言上进行深入研究,特别是蒙古文等黏着语。为了解决数据稀缺的问题,本研究创建了大规模的蒙古语预训练数据集并建立了三个下游任务的数据集,分别为新闻分类任务、命名实体识别任务(NER)、词性标注任务(POS),在此基础上提出了一种融入黏着语特征的蒙古文预训练语言模型IAMC⁃BERT。该模型将蒙古文黏着语特性融入tokenization阶段和预训练语言模型训练阶段。具体来说,to⁃kenization阶段旨在将蒙古文单词序列转换为包括词干和一些后缀的细粒度子词;训练阶段设计了一种基于形态学的掩蔽策略,以增强模型学习黏着语特征的能力。在三个下游任务上的实验结果表明,该方法超越了传统的BERT方法,成功地融入了蒙古文黏着语特征。
娜木汗金筱霖王炜华
关键词:蒙古文
基于深度学习的蒙古语AI合成主播被引量:1
2023年
目前,汉文AI合成主播已被运用于新闻内容生产和传播,为传统新闻媒体行业开辟了新的发展路径,但蒙古语AI合成主播技术的研究仍处于起步阶段。为了研发蒙古语AI合成主播系统,本文采用深度学习技术提出了基于嘴型分类的蒙古语AI合成主播模型。首先采用ObamaNet模型构建了蒙古语AI合成主播基线系统,因为基线系统的时间开销大,提出了基于嘴型分类的蒙古语AI合成主播模型,此方法使用9种嘴型标签代表所有的嘴型状态,将得到的语音特征同步到不同的嘴型,根据得到的嘴型选择候选帧,得到AI主播合成视频。文章构建了蒙古语AI合成主播视频语料库,并以此为基础进行了实验比较。结果表明,文中提出的模型可以生成自然度较好的蒙古语AI合成主播视频。
宝音都古楞飞龙王炜华张晖张晖
关键词:蒙古语
共1页<1>
聚类工具0