鲜国建 作品数:103 被引量:516 H指数:14 供职机构: 中国农业科学院农业信息研究所 更多>> 发文基金: 国家社会科学基金 中央级公益性科研院所基本科研业务费专项 国家科技支撑计划 更多>> 相关领域: 文化科学 农业科学 自动化与计算机技术 经济管理 更多>>
NSTL外文期刊引文数据刍动化拆分的研究与实践 被引量:1 2010年 文章简要分析了NSTL国际科学引文数据库的建设现状,讨论了期刊类型引文数据自动化拆分的必要性和可行性,深入研究了期刊类型引文的著录规律,提出采用分类的思想将引文数据划分为不同类型再分别加以拆分,设计出自动化拆分的具体流程和技术框架,实现了自动化拆分工具,并在农学领域进行了自动化批量拆分的应用实践,增强了大规模数据的自动化处理能力,提高了数据的整体质量及时效性。 鲜国建 赵瑞雪 金晨关键词:NSTL 引文数据 从文献计量角度探析粮食安全研究现状 被引量:1 2016年 为全面了解粮食安全领域的研究现状及研究热点,以汤森路透(Thomson Reuters)的Web of Science引文数据库收录的"粮食安全"文献作为数据源,基于数量和关键词从作者、期刊、机构等多维度对"粮食安全"进行文献计量分析。通过信息可视化软件CiteSpace工具,绘制出"粮食安全"领域的科学知识图谱,得出"粮食安全"领域的研究热点主要集中于气候变化、转基因技术、食物营养与安全、农业可持续发展等方面,以期为粮食安全问题的深入研究提供参考。 顾亮亮 赵瑞雪 朱亮 孔维升 寇远涛 鲜国建关键词:粮食安全 文献计量学分析 CITESPACE 农业立体污染防治重点领域信息门户建设实践 2017年 本文阐述NSTL重点领域信息门户农业立体污染防治专项的建设背景、门户构建策略与服务思路,提出学科语义知识库构建思路和情报加工质量控制方法。结合专项门户实践,总结学科门户资源建设的关键问题及采取的技术手段,提出开放资源整合与门户建设是图书馆拓展服务渠道,丰富知识服务内容,提升服务能力的重要措施。 赵瑞雪 金慧敏 鲜国建 罗婷婷关键词:信息门户 本体构建 情报产品 基于LDA模型的欧盟框架计划近10年农业科研项目研究主题发现 被引量:3 2017年 当前科研项目研究主题发现的方法主要是基于文献计量学,即通过统计项目的外部特征进行分析,但并未涉及项目研究内容。科研项目数据不仅是集技术情报、经济情报、商业情报于一体的知识载体,同时还具有科学性、具体性、探索性、创新性等特点。若能使用有效的方法对科研项目数据内容进行挖掘,将对科研工作者的研究创新以及国家科研政策制定产生积极影响。探讨了基础传统文献计量学方法的科研项目分析的局限性及存在的问题,对比分析了Latent Dirichlet Allocation(LDA)模型在主题发现领域的优势,提出了基于LDA模型的科研项目主题发现方法,并通过对欧盟框架计划近10年的农业科研项目数据进行分析,验证LDA模型在科研项目数据分析中的有效性。基于欧盟农业科研项目研究主题的分析结果发现,基于LDA模型在科研项目主题发现上能够充分挖掘科研项目的主题信息,是一种行之有效的科研项目分析方法。 王德川 赵瑞雪 寇远涛 鲜国建关键词:农业科研项目 LDA模型 主题发现 知识图谱构建管理系统比较研究与优化构想 2023年 [目的/意义]知识图谱作为人工智能时代的重要基石,为知识提供了一种新型组织与表示形式,而如何高效构建并合理地管理知识图谱成为当前图谱研究人员的迫切需求。研究聚焦于已有的知识图谱构建管理系统,以期对多款已有系统做全面深入的比较后,总结出当前知识图谱构建管理系统的建设新思路,并为更加通用、实用、好用的知识图谱构建管理系统研发提供参考。[方法/过程]目前大量学者针对知识图谱核心构建流程提出了先进的算法与技术,众多知识图谱相关机构也研发了多种类型的知识图谱构建管理系统,文中选择具有代表性的6款国内外主流知识图谱构建管理系统进行调研,分析各系统在业务流程中的系统特色,在系统的构建流程支持、技术选型及可用性等方面进行总结对比,并围绕当前用户对于知识图谱构建管理系统的最新需求总结已有系统存在的局限。[结果/结论]在深入对比分析的基础上,文中研究了一体化知识图谱协同构建管理系统的建设模式,总结并提出分布式协同构建、多图谱并行管理、多路径知识抽取、多类图存储引擎以及跨媒体与多模态知识图谱等知识图谱构建管理系统建设的优化构想。 马玮璐 鲜国建 赵瑞雪 赵瑞雪 黄永文 孙坦关键词:知识图谱 一种生物合成基因簇的挖掘方法、装置、设备及介质 本发明涉及生物合成基因簇挖掘技术领域,公开了一种生物合成基因簇的挖掘方法、装置、设备及介质,包括:选取实体类及对应的数据属性和对象属性来构建性状调控基因本体模型;构建性状调控基因本体模型中各类实体之间的三元组来生成性状调... 张丹丹 赵瑞雪 鲜国建 寇远涛一种基于知识图谱的档案管理模型构建方法及系统 本发明公开了一种基于知识图谱的档案管理模型构建方法及系统,方法包括:获取计算机可读格式的档案文本,识别档案文本中最小的知识单元,基于各个最小的知识单元的相关关系,形成各知识单元间的语义联系;基于各知识单元间的语义联系,通... 雷洁 赵瑞雪 鲜国建 寇远涛 侯希闻 仲晓春 刘杉 许怡然 程思梦文献传递 农业科学叙词表的OWL表示研究 在当今网络信息时代,传统的信息组织方式在组织海量的信息资源时也在不断地发展变化。本体(ontology)是一种能在语义和知识层次上描述信息系统的概念模型建模工具,因而作为一种新的信患组织方式被广泛关注.本文尝试将农业领域... 鲜国建 孟宪学 常春关键词:本体 叙词表 文献传递 基于TF-IDF和领域词典的主题内容聚合分析方法 本发明公开了一种基于TF‑IDF和领域词典的主题内容聚合分析方法,属于情报信息处理领域。基于TF‑IDF获取主题需求词的扩展词集;将其作为检索文本遵循基于领域词典的检索策略完成对资源池中多种类型资源的检索,经过审核进行资... 赵瑞雪 寇远涛 张洁 鲜国建 仲跻亮文献传递 农业中文期刊论文信息自动识别与抽取模型构建及实现 2019年 面对农业领域丰富的中文期刊论文资源,为实现对农业中文期刊论文文本信息的高效利用,识别与抽取论文中信息已成为一种非常迫切的需求。通过对现有论文信息识别与抽取方法及工具进行调研,确定基于条件随机场算法以及GROBID工具进行农业中文期刊论文信息的识别与抽取。本文构建了农业中文期刊论文信息识别与抽取级联模型,并通过数据采集、文本预处理、特征选择、序列标注、特征模板以及模型训练及评估等一系列流程对模型进行实现与应用。实验结果表明,在进行农业中文期刊论文信息识别与抽取时,该模型在论文头信息以及引文信息抽取方面具有较好的效果,在章节标题以及段落信息的识别上仍然存在不足。 薛欢欢 赵瑞雪 寇远涛 鲜国建关键词:信息抽取 条件随机场