汪璐
- 作品数:37 被引量:57H指数:4
- 供职机构:中国科学院高能物理研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中国科学院知识创新工程重要方向项目更多>>
- 相关领域:自动化与计算机技术理学机械工程更多>>
- 实现文件动态副本的键值文件系统及方法
- 本发明公开了一种在键值文件系统中实现文件动态副本的方法,用于针对特定文件进行动态副本的管理,该方法包括:由客户端定位特定文件的静态副本所在的第一子卷;从第一子卷读取特定文件的扩展属性,扩展属性中包括特定文件已有的动态副本...
- 汪璐程耀东黄秋兰
- 文献传递
- 高能物理科学数据中心智能运维系统被引量:2
- 2022年
- 【目的】高能物理科学数据中心运维环境复杂,监控工具种类繁多,功能相对重叠且监控数据无法互通,日常运维面临巨大的挑战。为高效运用监控数据,提高数据中心运维能力,本文实现了高能物理科学数据中心智能运维系统。【方法】本文结合工业大数据技术、机器学习技术和数据中心运维需求,设计了通用的数据中心运维技术架构。介绍监控数据采集、分析、存储、共享、可视化等系统核心功能及其实现方式,以及依托该系统在数据中心数据存储、计算服务、网络安全等日常运维的具体应用效果。【结果】本文设计的运维框架,在高能物理科学数据中心日常运维中得到了成熟的应用和实践,提升了数据中心运维管理能力。【结论】智能运维系统在高能物理科学数据中心的应用,加速了运维监控从数据持久化、统一化到数据业务化、生态化的价值演进,实现了基于数据驱动的数据中心智能化运维生态。
- 胡庆宝郑伟郑伟汪璐颜田
- 关键词:大数据
- 多网格平台上的高能物理数据共享被引量:2
- 2009年
- 当前,高能物理网格计算平台主要依赖于单一的网格中间件与操作系统.而实际上,越来越多的异构资源需要被整合进来.因此,如何在多个平台上(包括不同的网格中间件与操作系统)共享高能物理网格数据是一个基本的研究课题.本文在不改动原有平台的基础上,提出并实现一个网格数据共享系统.基于该系统用户可以透明的在多个平台上管理和共享海量数据.本文主要描述这个系统的体系结构、实现方法、性能优化以及使用场景.
- 程耀东汪璐陈刚
- 关键词:网格互操作数据共享高能物理
- 国家高能物理科学数据中心分布式数据处理平台被引量:4
- 2022年
- 【目的】本文对国家高能物理科学数据中心分布式数据平台进行系统全面介绍,为高能物理及相关领域大科学实验的数据处理提供参考。【方法】文章介绍了国家高能物理科学数据中心分布式数据处理平台的总体构成、运行模式和智能运维等方面的关键技术。通过分析高能物理实验数据处理的计算特点与实际需求,介绍了数据中心“一平台多中心”的数据处理平台建设思想,阐述了平台为高能物理实验提供的跨地域资源共享、高性能海量数据访问以及用户实时交互服务等技术方案设计与实现。【结果】文章列举了数据中心分布式数据处理平台对两个高能物理实验的支持实例,助力科学研究成果获取。【结论】国家高能物理科学数据中心分布式数据处理平台已经成为高能物理学科的重要基础设施和组成,是学科融合、开展新研究方法的主要场所,满足了粒子物理、理论物理、空间天文、射线学科、加速器设计等科研领域的数据处理需求。
- 石京燕黄秋兰汪璐李海波杜然姜晓巍胡庆宝郑伟闫晓飞张玄同
- BES文件集操作服务
- 改造后的BES实验将在未来五年内累积5PB的实验数据,分析处理这样庞大的数据,需要充分利用BES合作组内分布在世界各地的计算、存储和人力资源。地理上的分布性对BES计算基础设施带来很高的要求。网格计算技术解决了BES分布...
- 汪璐
- 关键词:网格计算
- 高能同步辐射光源科学数据处理平台规划与设计被引量:7
- 2020年
- 【目的】高能同步辐射光源(HEPS)是我国“十三五”期间优先建设的、为国家的重大战略需求和前沿基础科学研究提供技术支撑平台的国家重大科技基础设施,开展超高空间分辨、时间分辨、能量分辨的高通量同步辐射实验。其一期建设的十五条光束线实验站,预计平均每天产生200TB的原始实验数据,峰值可达每天500TB。这些实验数据需要得到存储、共享,并能够进行准确实时的处理与分析。【方法】科学数据处理平台包括基础设施、科学软件、网络、计算、存储、公共信息服务等系统。【结果】该平台将为HEPS设施、科研人员、工程技术人员以及用户提供包括设数据传输、数据存储、数据分析、数据共享、科研协同等在内的网络、计算、存储等基础设施能力,以及提供科学软件、通用软件、通用信息系统和网络信息安全服务等。
- 齐法制黄秋兰胡皓田浩来田浩来汪璐王彦明赵海峰张红梅
- 关键词:数据存储数据共享
- 面向本地分布式存储系统的动态副本策略被引量:7
- 2010年
- 针对本地分布式存储系统的拓扑结构与存储组成单元的特性,提出了一种基于频度的动态副本算法FBDR。FBDR分别采用基于密度的单次频度分析和基于区间长度的两次频度聚合的方法对文件访问流进行分析,作为确定热点文件的依据,具有较高的命中率。在副本创建位置选择上,综合考虑了存储单元的可用空间、负载、IO性能等因素,使热点文件获得更高的IO速率,同时兼顾了存储单元之间的负载与资源利用的平衡。
- 伍文静程耀东汪璐武杰陈刚
- 海量存储系统元数据服务器的设计及性能优化被引量:4
- 2012年
- 设计适用于GRASS海量存储系统的元数据服务器,分析并优化3个影响元数据性能的因素:元数据组织方式,通信性能和搜索效率,利用Bloom Filter算法进行名字空间搜索,在此基础上实现目标系统的文件名查询优化。实验结果证明,目标系统的元数据处理性能得到明显提升,基本满足大规模高能物理计算的需求。
- 汪璐程耀东陈刚
- 关键词:海量存储系统元数据服务BLOOM
- 基于随机森林的高能物理数据放置策略被引量:1
- 2020年
- 随着LHAASO高海拔宇宙线等高能物理实验规模的不断扩大,每年需要存储PB级的海量物理数据。高能物理海量存储系统一般采用随机的数据放置策略,没有考虑数据访问场景和服务器节点、存储设备的差异性。针对以上问题,提出一种异构存储环境下基于随机森林算法的数据放置策略,根据存储设备性能差异划分快慢存储池,同时对后期文件的读写访问场景进行预测和识别,综合考虑当前设备负载为数据找到最佳的放置位置。使用真实物理实验数据验证了算法的有效性。
- 程振京程耀东陈刚陈刚汪璐胡庆宝
- 关键词:分布式存储系统异构存储存储池
- 基于键值对系统实现树形目录结构的数据存储系统及方法
- 本申请公开了一种基于键值对k-v系统实现树形目录结构的数据存储系统服务端,用于与数据存储系统客户端通信以进行文件的写入和读取,包括:目录服务器集群,由若干个目录服务器组成,用于存储所写入文件的目录信息并以树形目录结构的形...
- 黄秋兰程耀东汪璐
- 文献传递