国家社会科学基金(13CTQ035) 作品数:8 被引量:199 H指数:6 相关作者: 何琳 常颖聪 庄倩 陈雅玲 叶兰 更多>> 相关机构: 南京农业大学 东南大学 深圳大学 更多>> 发文基金: 国家社会科学基金 南京农业大学SRT基金 江苏省社会科学基金 更多>> 相关领域: 文化科学 自动化与计算机技术 更多>>
面向文本挖掘的植物生长发育实体识别研究 被引量:1 2014年 【目的】研究从文本中识别植物生长发育实体(Plant Growth and Development Stage Named Entity,PDSE)的抽取。【应用背景】PDSE从本质上来说是一种命名实体。目前有关命名实体的识别已经成为自然语言处理领域最有价值的基础技术之一,被广泛应用于多种自然语言处理系统中。【方法】采用基于条件随机场和规则的混合策略,提出并实现针对PDSE特征的CRF特征模板、特征函数以及抽取规则的方法,并利用PubMed数据库收录的论文进行抽取效果测试。【结果】实验表明本文提出的混合策略能取得较高的准确率和召回率。【结论】本研究对生物学文本抽取具有一定的借鉴意义。 汪润 何琳 王东波 黄水清 范远标关键词:命名实体识别 条件随机场 科研人员科学数据重用意愿的影响因素研究 被引量:21 2019年 [目的/意义]了解科研人员进行科学数据重用的现状以及影响其进行数据重用的因素。[研究设计/方法]针对科学数据重用的特点,通过对500余名科研人员的调研,利用结构方程模型对科研人员科学数据重用意愿影响因素进行研究。[结论/发现]重用数据质量、重用数据来源、进行科学数据重用的科研人员背景以及科学数据重用规则因素都会对科学数据重用意愿和科学数据重用满意度产生正向影响,其中数据质量因素会正向影响继续进行科学数据重用意愿,重用数据来源、科研人员背景以及重用规则因素会间接正向影响继续重用意愿。[创新/价值]采用量化方法发现了影响科研人员科学数据重用意愿的多重影响因素,可为科研数据管理提供参考和建议。 文静 何琳 韩正彪关键词:科学数据 数据重用 影响因素 结构方程模型 高校图书馆科研数据联盟建设策略——以荷兰3TU.Datacentrum为例 被引量:27 2015年 [目的/意义]研究高校图书馆科研数据联盟的建设策略。[方法/过程]利用案例研究法分析荷兰3所高校图书馆共同建设的科研数据联盟3TU.Datacentrum,介绍其发展历程、数据资源建设、系统平台、服务方式,并分析其基本特点。[结果/结论]3TU.Datacentrum数据联盟具有图书馆主导、集中建设、一体化服务、广泛合作交流等突出特点,结合我国高校科研数据管理与共享现状,提出如下建设策略:应充分发挥图书馆的作用,立足于数据共享现实需求和科研管理政策要求,建立我国高校图书馆数据联盟,借此提高我国科研数据的质量与影响力,并合作开展数据管理专业教育等相关工作。研究结果对于我国高校图书馆科研数据联盟的建设发展具有重要参考价值。 孟祥保 叶兰 常娥关键词:数据共享 数据管理服务 科学数据 科研人员数据共享意愿研究 被引量:53 2014年 科研人员作为科学数据的生产、使用和管理者,是否积极倡导并参与数据共享将直接影响到科学数据公开获取的进程和发展。相对于国外来自期刊杂志、基金管理委员会各界等对数据共享数据管理的规定,国内尚没有完善的数据共享政策,数据共享还没有得到普及。文章引入意向影响模型理论TPB和TAM建立科学数据共享意愿模型,研究影响科研人员数据共享行为意愿的因素,采用问卷调查的方法进行数据采集,利用AMOS17.0对假设进行了验证,结果显示态度、主观规范是直接影响因素,感知行为控制、感知风险、感知有用性为间接影响因素。最后根据对验证结果的具体分析,对如何促进科研人员数据共享提出了建议。 何琳 常颖聪关键词:数据共享 结构方程模型 计划行为理论 技术接受模型 面向关联数据的科学实验数据语义描述模型研究——以水稻基因实验为例 被引量:4 2017年 基于项目实践,文章提出了从知识获取、知识表示、知识组织、知识挖掘四个方面构建面向关联数据的科学实验数据语义描述模型的思路。以水稻基因实验为例,通过文献调研、网络调查、书籍知识获取等途径中识别出有关的信息资源,提炼出核心领域知识以及知识之间的关联,形成核心元数据,通过层层挖掘和复用元数据标准构建了水稻基因实验数据语义描述模型,以开源软件D2R Server为工具,实现了以D2RQ Mapping语言为基础的语义映射和模式转换。 徐潇洁 何琳 陈雅玲 乔粤关键词:科学数据 关联数据 语义描述 科学数据共享中科研人员共享行为的演化博弈分析 被引量:30 2015年 科研人员是科学数据的生产者和使用者,是科学数据共享体系中的重要主体。将科学数据共享体系中的科研人员的共享行为划分为分享信息与不分享信息两种,并将其放在演化博弈的理论框架中,建立参与科学数据共享的科研人员间的演化博弈模型,分析科学数据共享的动态演化过程。探讨了科研人员之间的信任程度的高低对实现科学数据共享的影响。研究结果表明,科学数据共享的实现有赖于科研人员之间的相互合作和信任,建立健全的保障制度,阻止机会主义和"搭便车"行为的出现,可以促进科学数据的共享。 庄倩 何琳关键词:科学数据 演化博弈论 基于关联数据的科学数据组织研究 被引量:15 2016年 文章在对科学实验数据建立描述模型的基础上,通过对相关的科学实验描述本体的复用和扩展,构建以科学实验描述本体为基础的科学数据组织模式。采用RDF格式存储科学实验相关元数据,深入挖掘和揭示了科学数据中各类资源对象的语义内涵与关联关系,将与科学实验数据相关的科研机构、文献数据库以及科研成果等外部信息进行有效语义关联,建立了动态的、开放的科学实验数据知识组织模式。 庄倩 常颖聪 何琳 徐潇洁 乔粤 陈雅玲关键词:关联数据 本体 科学数据 元数据 国内外科学数据出版研究进展 被引量:63 2014年 立足科研人员、科研机构、期刊杂志3个方面,对科学数据出版的发展现状进行阐述,分析各方对科学数据出版的态度以及科学数据出版在科学交流中的影响,总结数据仓储、机构库和期刊自行发表3种主要出版模式,并分析科学数据出版过程中所面临的元数据、隐私保护、组织技术、出版机制以及知识产权等关键问题,最后针对数据出版的发展完善提出建议。 何琳 常颖聪关键词:科学数据 出版模式 出版现状