万福成 作品数:48 被引量:63 H指数:5 供职机构: 西北民族大学 更多>> 发文基金: 国家科技支撑计划 中央高校基本科研业务费专项资金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 一般工业技术 电气工程 文化科学 更多>>
基于云端服务的藏汉双语教学构件重构平台关键技术研究与运用 何向真 万福成 孟祥和 李亚超 马宁 徐涛 马晓伟 夏建华 单义民 傅佳瑶 课题组在任务下达以后,积极与国内外藏文专家、计算机专家及一线教学老师沟通交流,解决课题进展中遇到的各种问题,经过三年时间的艰苦研发,达到了课题的预期目标,超额完成了课题任务。在该期间课题组取得了一系列科技成果,其中包括申...关键词:关键词:藏汉双语教学 融合韵律特征的诗歌生成模型 2024年 诗歌生成中的韵律规范和主题一致性一直以来都是自然语言生成领域的研究热点。为提升诗歌生成中的韵律规范,提出了基于Transformer结合韵律特征的诗歌生成模型(Transformer and prosodic features poetry generation model,TPPG)。根据韵律特征建立平仄韵律词库和平声韵脚词库,在Transformer编码器中引入平仄韵律编码,模型训练过程中可以捕获更多平仄韵律特征的信息,学习到多种诗歌韵律;最终根据建立的平声韵脚词库规范诗歌生成韵脚,运用极大后验概率对于候选的诗歌选择当前赋有韵律特征规范的最优诗句,整体提升诗歌规范性和流畅性。实验结果表明TPPG模型生成的诗歌能够很好地符合韵律,在人工评价和机器评价中均有提高。 吴林东 何向真 万福成关键词:韵律特征 基于机器学习的学术论文推荐方法研究 2023年 目前,学术论文的数量呈指数增长,论文推荐也已成为一项有吸引力的研究.论文推荐系统具有一定的重要性和优势.文章通过调查已有的一些论文推荐方法,如基于协同过滤的、图的、混合等方法,并对已有方法进行分析和总结的基础上,指出了目前学术论文推荐研究面临的挑战,以期探索出解决挑战的新思路、新方法. 魏斌 万福成 于洪志 马宁 杨恒关键词:协同过滤 图结构 融合事件特征及语义角色标注的藏文信息抽取技术 被引量:1 2018年 本文在藏语短语句法分析的基础上,融入功能语义信息线索,采用在藏语短语句法树库的基础上加入语义角色标注的方法,并融合事件触发词信息,对藏文信息进行抽取,并通过实验进行了对比分析。本文事件特征融合与已标注信息对藏文信息抽取有帮助,本文模型可以很好地应用于藏文信息抽取工作。 万福成 马宁 何向真关键词:功能语义 语义角色标注 面向藏族地区的远程教育应用研究 对开展面向藏族地区的远程教育的必要性进行综合论述,分析了藏族地区开展远程教育的几种形式,并重点介绍了开展基于Internet的远程教学的主要模式,通过比较面向藏族地区的远程教育和一般远程教育的区别,对开展藏区远程教育需要... 金雅声 吴志强 万福成 孟祥和关键词:远程教育 藏汉双语 文献传递 基于条件随机场的多线索中文语义角色标注 被引量:3 2020年 随着人工智能和中文信息处理技术的产业化发展,自然语言处理相关研究已逐步深入到语义理解层次上,而中文语义角色标注则是语义理解领域的核心技术.针对现有线性标注模型无法满足语义信息技术产业化发展对准确率的需求,提出了采用多层级语言学线索组合的模型优化方法.首先,选取综合标注性能优异的条件随机场基准模型,构建相配套的语义角色标注语料库.然后,在模型中融入词法及句式等多层级语言学线索,实现了对模型的多层次优化.最后,通过对比实验各项标注指标,论证了融入的相关语言学线索可以有效增强线性序列模型的标注性能. 王一成 万福成 马宁关键词:自然语言处理 语义角色标注 条件随机场 基于改进混沌分区算法的模糊信息抽取 被引量:6 2019年 在大数据环境下进行模糊信息挖掘抽取中受到数据之间的小扰动类间干扰的影响,导致信息抽取的特征聚类性不好。为此提出一种基于改进混沌分区算法的模糊信息抽取方法,对高维数据信息流进行分布式结构重组,以Lorenz混沌吸引子作为训练测试集进行大数据模糊信息抽取的自适应学习训练,采用相空间重构技术对大数据的混沌吸引子负载特征量进行自相关特征匹配处理,提取模糊信息的平均互信息特征量,结合关联规则模糊配对方法进行大数据混沌分区,实现模糊信息的优化聚类,根据数据聚类结果实现模糊信息准确抽取,对抽取的高维模糊信息进行特征压缩,降低计算开销。仿真结果表明,采用该方法进行大数据样本序列的模糊信息抽取的聚类性较好,抗类间扰动能力较强,模糊信息抽取的准确概率较高,在数据挖掘和特征提取中具有很好的应用价值。 万福成关键词:大数据 混沌 聚类 一种融合形式化语法和语言学语法的藏汉机器翻译方法 本发明公开了一种融合形式化语法和语言学语法的藏汉机器翻译方法,包括以下步骤:A、将双语句子反向转换成双语句法结构形式,形成藏语短语句法分析模型以及藏汉机器翻译模型;B、将反向转换后的双语短语进行特殊标记,进行句法分析训练... 万福成 马宁 何向真 孟祥和文献传递 结合池化技术和特征组的汉语语义角色标注 被引量:2 2021年 利用基于统计机器学习方法进行汉语语义角色标注(Semantic Role Labeling,SRL)存在人工抽取特征工作繁琐低效、模型难以捕捉长句上下文语义信息等问题.对此,提出BiLSTM-MaxPool-CRF融合模型进行汉语SRL,同时进行模型性能优化研究.首先,在训练语料中融入词性、论元标记、短语句法等多层级语言学特征;然后,结合AvgPool技术对特征组进行采样选取;最后,通过多组实验结果表明,相比于未采样提取的多特征组,经过池化技术采样提取的多特征能够显著提高模型的性能. 朱傲 万福成 马宁 车郭怡关键词:语言学特征 基于J2EE与MVC框架的现代远程教育系统设计 被引量:7 2010年 针对大型远程教育系统设计中缺乏系统整体结构设计的现状,提出了基于J2EE与MVC的三层的远程教育平台的系统结构、系统基本架构设计、系统基本架构实现的MVC设计模式和Structs框架。该框架设计不仅充分考虑了系统的功能性需求,而且满足了可扩展性、可移植性和鲁棒性等非功能性需求。 沈江 于洪志 万福成 闫敏敏关键词:架构设计 J2EE STRUTS