文永华
- 作品数:91 被引量:75H指数:5
- 供职机构:昆明理工大学更多>>
- 发文基金:国家自然科学基金云南省自然科学基金国家民委科研基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学电子电信更多>>
- 基于依存距离惩罚的泰汉神经机器翻译方法
- 2022年
- 在“一带一路”倡议的背景下,泰国与我国的沟通日益密切,泰汉机器翻译具有很高的应用需求。作为低资源语言机器翻译,泰汉之间缺乏大规模、高质量的平行语料,导致翻译效果不佳。融入依存句法知识可以使译文更符合句法约束,弥补没有大规模平行语料的缺陷,但泰语缺少成熟的依存解析工具和依存标注训练集。针对以上问题,基于无监督迁移获取泰语依存句法结构知识,并提出依存距离惩罚机制以减少依存噪声对翻译性能的干扰,并通过基于依存感知注意力机制的Transformer架构将所提方法融入翻译。实验结果表明,该方法能有效提升泰汉神经机器翻译的效果。
- 张弘弢文永华王剑
- 关键词:泰语
- 融合标签关联的隐空间数据增强多标签文本分类方法
- 本发明公开融合标签关联的隐空间数据增强多标签文本分类方法,通对批次中的数据进行编码,然后通过双向LSTM和attention进行训练,并对标签列表中的先验知识进行挖掘,最后将编码后的数据与得到的标签先验知识进行一种隐空间...
- 线岩团苗育华王红斌文永华
- 融入双语词典的无监督汉-越神经机器翻译方法
- 本发明涉及融入双语词典的无监督汉‑越神经机器翻译方法,属于自然语言处理技术领域。本发明所提方法的具体思路为:分别收集汉语、英语和越南语的单语语料,并对语料进行预处理;利用基于英语枢轴的方法从单语中学习汉越双语词典;利用双...
- 余正涛王可超郭军军王振晗文永华相艳
- 文献传递
- 基于句子特征向量的汉越伪平行句对抽取的方法
- 本发明涉及基于句子特征向量的汉越伪平行句对抽取的方法,属于自然语言处理技术领域。本发明首先收集并预处理汉越句对的平行与非平行的训练语料和测试语料,以及用于伪平行句对抽取的可比语料;标注汉越句法中差异大的词性;再在嵌入层中...
- 余正涛黄继豪线岩团郭军军翟家欣文永华高盛祥
- 文献传递
- 融入分类词典的汉越神经机器翻译集外词处理方法
- 本发明涉及融入分类词典的汉越神经机器翻译集外词处理方法,属于自然语言处理技术领域。本发明对集外词进行了分类,并且发现不同类别的集外词可以采用不同的方法处理,然后有针对性的构建出分类词典,其中双语词典用以解决词表外稀有词的...
- 赖华贾承勋余正涛朱恩昌车万金文永华高盛祥
- 一种基于对比学习融入动态调整机制的文本聚类方法
- 本发明公开了一种基于对比学习融入动态调整机制的文本聚类方法,其特征在于,基于语境增强的方法得到一组增强文本,通过预训练模型得到增强文本的特征表示,通过K‑Means聚类方法得到语义集群的初始簇心;提高文本聚类分布的置信度...
- 王红斌李瑞辉线岩团文永华
- 一种基于列表和身份一致性约束的行人重识别算法
- 本发明公开了一种基于列表和身份一致性约束的行人重识别算法,属于智能监控技术领域,本发明通过列表一致性获得每个行人的列表相似性,从而利用样本中包含的大量判别信息,通过对编码系数施加身份一致性约束以进一步改善字典判别能力,采...
- 李华锋董能文永华竹晋廷线岩团王红斌
- 文献传递
- 一种基于英语枢轴的弱监督汉越双语词典构建方法
- 本发明涉及一种基于英语枢轴的弱监督汉越双语词典构建方法,属于自然语言处理技术领域。本发明包括步骤:分别收集汉语、英语和越南语的单语语料以及对语料进行预处理;基于种子词典的方法将汉越词向量分别对齐到英语词向量共享空间;在英...
- 余正涛陈亚豪张亚飞文永华朱俊国高盛祥
- 文献传递
- 融入分类词典的汉越混合网络神经机器翻译集外词处理方法被引量:3
- 2019年
- 在神经机器翻译中,因词表受限导致的集外词问题很大程度上影响了翻译系统的准确性。对于训练语料较少的资源稀缺型语言的神经机器翻译,这种问题表现得更为严重。近几年,受到外部知识融入的启发,该文在RNNSearch模型基础上,提出了一种融入分类词典的汉越混合网络神经机器翻译集外词处理方法。对于给定的源语言句子,扫描分类词典以确定候选短语句对并标签标记,解码端利用词级组件和短语组件的混合解码网络,很好地生成单词集外词和短语集外词的翻译,从而改善汉越神经机器翻译的性能。在汉越、英越和蒙汉翻译实验上表明,该方法显著提高了准确率,对于资源稀缺型语言的神经机器翻译性能有一定的提升。
- 车万金余正涛郭军军文永华于志强
- 关键词:分类词典资源稀缺
- 结合兼类词词性消歧模型和字典的越南语词性标记方法
- 本发明涉及结合兼类词词性消歧模型和字典的越南语词性标记方法,属于自然语言处理技术领域。本发明首先通过整理越南语字典为基础得到非兼类词字典和兼类词字典;其次根据越南语特点,选取越南语词性标注特征,形成兼类词词性消歧模型;再...
- 郭剑毅赵晨余正涛王红斌文永华
- 文献传递