李跃鹏
- 作品数:13 被引量:67H指数:3
- 供职机构:中国科学院计算机网络信息中心更多>>
- 发文基金:国家自然科学基金中国科学院战略性先导科技专项更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 关联大数据管理技术:挑战、对策与实践被引量:7
- 2018年
- 【目的】分析关联大数据的概念、内涵与特征,针对关联大数据管理的技术挑战,探讨关联大数据管理技术的对策和解决思路。【方法】结合NoSQL数据管理技术、分布式图计算技术、大数据流水线技术等给出应对挑战的思路,并基于此思路形成大规模图数据仓库加工系统gETL。【结果】该方法和系统在NSFC-KBMS和WDCM项目中得到了应用,实现了大规模知识型数据和生物数据的有效管理,满足了多元化的数据管理需求。【局限】需要结合应用的情况,进一步完善方法与系统。【结论】通过采用NoSQL数据存储技术、分布式图计算技术、大数据流水线技术以及gETL系统,可以很好地解决关联大数据的管理问题。
- 沈志宏姚畅侯艳飞吴林寰李跃鹏
- 关键词:关联数据知识图谱大数据
- 一种基于关系型数据库的工作流管理系统被引量:3
- 2016年
- 本文提出了一种基于关系型数据库的工作流管理系统。该方案将业务分为基础业务与拓展业务,然后通过一个简单的工作流模型表示基础业务逻辑,并使用关系型数据库处理拓展业务。此外,该方案将业务逻辑与业务的设计相结合,形成了一个通过配置即可开发信息管理系统的平台。该系统的实际应用表明该方案实现简单,能够处理大部分其他工作流模型无法表示的工作流模式,并且该系统易于业务人员操作,能够达到快速开发的目的。
- 李跃鹏及俊川李新史广军
- 关键词:工作流关系型数据库工作流模型
- 对等代理模式开放科学云联邦系统框架被引量:1
- 2023年
- 开放科学旨在促进全球科技合作以解决诸如新冠肺炎、碳中和、自然灾害等全球性问题与挑战,然而不同机构建设的开放科学云平台之间相互独立,无法实现最大化的资源共享与科研协作,因此研究云平台互联系统结构与资源共享技术方法成为开放科学领域的一个重要课题。本文针对开放科学云平台资源管理特点,提出了一种对等代理模式的云联邦系统框架(PBMFCS),设计了云联邦系统的总体架构、逻辑架构及部署模型,讨论分析了框架的系统特性及关键技术问题。在此基础上,结合“全球开放科学云”项目需求设计实现了一个可提供基础设施服务(IaaS)层联邦云服务的原型系统,初步验证了对等代理模式云联邦系统框架的可行性与有效性,为“中国科技云”(CSTCloud)与“全球开放科学云”(GOSC)项目的未来建设与发展提供了技术参考。
- 李跃鹏张海明张海明张丽丽
- 基于word2vec的关键词提取算法被引量:45
- 2015年
- 随着近些年深度学习的兴起,词语在计算机中的表示有了重大突破;而长期以来关键词提取算法均以词语作为特征进行计算,效果并不理想。因此,本文提出了一种基于深度学习工具word2vec的关键词提取算法。该算法首先使用word2vec将所有词语映射到一个更抽象的词向量空间中;然后基于词向量计算词语之间的相似度,最终通过词语聚类得到文章关键词。实验表明该算法对于篇幅长文章的关键词提取的准确率要明显高于其他算法。
- 李跃鹏金翠及俊川
- 关键词:关键词提取
- 科学大数据管理技术与系统被引量:8
- 2018年
- 由于现代科学发现越来越依赖于大规模科学数据的分析处理,如何高效管理科学大数据业已成为当下亟待解决的问题。文章分析了科学大数据的应用场景和需求,阐述了科学大数据在规模动态化、流水线管理、统一访问、数据共享(SPUS)4个方面面临的挑战。提出了包括计算和存储管理、数据流水线管理、数据融合查询管理、数据共享管理4个模块的科学大数据管理系统体系结构,并分析了系统中存在的关键技术问题。最后,介绍了国家重点研发计划项目"科学大数据管理系统"的研发进展及其未来的研究方向。
- 黎建辉李跃鹏王华进陈明奇
- 关键词:流水线数据共享
- 一种适用于多种大数据管理系统的交互式查询方法
- 本发明涉及一种适用于多种大数据管理系统的交互式查询方法,其步骤包括:1)建立关联文档模型,其包括文档集与关联集,所述关联集是文档之间的关联构成的集合;2)将不同的原始数据模型转换为关联文档模型,通过关联文档模型将不同的数...
- 沈志宏李跃鹏黎建辉
- 文献传递
- 一种基于图遍历的SPARQL查询优化方法
- 本发明公开了一种基于图遍历的SPARQL查询优化方法。本方法为:1)使用属性图表示RDF数据中三元组,然后利用Bigtable模型存储RDF数据,得到RDF数据对应的Bigtable数据;2)将SPARQL查询转化对RD...
- 李亮沈志宏周园春黎建辉朱小杰刘东江李跃鹏
- 文献传递
- 一种适用于多种大数据管理系统的数据模型转换及查询分析方法
- 本发明涉及一种适用于多种大数据管理系统的数据模型转换及查询分析方法。该方法包括:1)建立关联文档模型,其包括文档集与关联集,关联集是文档之间的关联构成的集合;2)将数据的语义信息,将不同的原始数据模型转换为关联文档模型;...
- 黎建辉李跃鹏沈志宏
- 文献传递
- 一种适用于多种大数据管理系统的交互式查询方法
- 本发明涉及一种适用于多种大数据管理系统的交互式查询方法,其步骤包括:1)建立关联文档模型,其包括文档集与关联集,所述关联集是文档之间的关联构成的集合;2)将不同的原始数据模型转换为关联文档模型,通过关联文档模型将不同的数...
- 沈志宏李跃鹏黎建辉
- 文献传递
- 一种基于图遍历的SPARQL查询优化方法
- 本发明公开了一种基于图遍历的SPARQL查询优化方法。本方法为:1)使用属性图表示RDF数据中三元组,然后利用Bigtable模型存储RDF数据,得到RDF数据对应的Bigtable数据;2)将SPARQL查询转化对RD...
- 李亮沈志宏周园春黎建辉朱小杰刘东江李跃鹏