王英林
- 作品数:4 被引量:8H指数:2
- 供职机构:上海财经大学信息管理与工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于抽取规则和本体映射的语义搜索算法被引量:2
- 2018年
- 针对目前语义搜索过程中存在效率低、用户推荐误差大等问题,提出一种基于抽取规则和本体映射的语义搜索算法.首先根据用户语义搜索要求抽取语义中的元素和属性,解决数据利用率低的缺陷;然后建立语义模型,构建本体之间的元素及属性之间的映射,消除用户需求和计算机之间的语义偏差;最后将语义搜索算法应用于用户个性化推荐系统.实验结果表明,该语义搜索算法有效提高了搜索效率,降低了用户个性化推荐误差.
- 周诗源王英林
- 关键词:信息检索语义搜索本体映射抽取规则个性化推荐
- 财经院校计算机专业综合能力培养方法探索
- 2015年
- 针对目前财经类院校计算机专业教学目标定位不够清楚,计算机和财经管理知识培养厚此薄彼的问题,构建了培养具有财经特色的计算机专业综合能力的知识框架。根据财经类高校计算机专业学生的能力要求,建立培养这种能力所需要掌握的知识结构,以及与之相适应的合理课程体系。知识体系的科学设置将有效提高学生解决财经领域实际问题的计算机综合能力。
- 韩松乔王英林韩冬梅黄海量
- 关键词:财经院校计算机科学课程体系
- 基于布谷鸟搜索优化算法的多文档摘要方法被引量:4
- 2020年
- 为最大化生成摘要的信息量,提出一种基于布谷鸟搜索(CS)算法与多目标函数的多文档摘要方法。对多文档数据进行预处理,通过句子分割、分词、移除停用词和词干化将文档转化为词语的基本处理形式,计算经数据预处理后的句子信息量得分并将其作为CS算法的输入,再基于多目标函数生成包含原始文档重要信息的句子以组成最终的摘要。实验结果表明,与基于粒子群优化算法和双层K最近邻算法的多文档摘要方法相比,该方法在最大化生成摘要信息量的前提下,保证了高可读性和低冗余性,并且在DUC基准数据集上的摘要平均准确度高达0.99。
- 周诗源王英林
- 关键词:多文档摘要数据预处理
- 基于预训练语言模型的语法错误纠正方法被引量:2
- 2022年
- 自然语言处理中的语法错误纠正(GEC)任务存在着低资源性的问题,学习GEC模型需要耗费大量的标注成本以及训练成本.对此,采用从掩码式序列到序列的预训练语言生成模型(MASS)中的迁移学习方式,充分利用预训练模型已提取的语言特征,在GEC的标注数据上微调模型,结合特定的前处理、后处理方法改善GEC模型的表现,从而提出一种新的GEC系统(MASS-GEC).在两个公开的GEC任务中评估该系统,在有限的资源下,与当前GEC系统相比,达到了更好的效果.具体地,在CoNLL14数据集上,该系统在强调查准率的指标F上表现分数为57.9;在JFLEG数据集上,该系统在基于系统输出纠正结果与参考纠正结果n元语法重合度的评估指标GLEU上表现分数为59.1.该方法为GEC任务低资源问题的解决提供了新视角,即从自监督预训练语言模型中,利用适用于GEC任务的文本特征,辅助解决GEC问题.
- 韩明月王英林
- 关键词:自然语言生成