张鹏
- 作品数:8 被引量:12H指数:2
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于PCI总线数据采集卡的实时测控技术被引量:2
- 2009年
- 我们从软件技术的角度,论述了在Windows XP环境下基于PCI总线数据采集卡实现实时测控所需要的关键技术、软件体系结构和开发方法。遵循本文所讨论的技术路线,开发了DFQ系列多方位牵引床的测控软件,提高了被控系统的控制精度和可靠性,增强了系统的可用性。
- 孙业张鹏张哲梁敏
- 关键词:PCI总线WDM设备驱动程序软件体系结构
- 基于申威1600的3级BLAS GEMM函数优化被引量:10
- 2016年
- BLAS是当前科学计算领域重要的底层支持数学库之一,其中的3级BLAS函数应用最为广泛.本文基于国产申威1600平台,提出了一种基础线性代数库BLAS的三级函数通用矩阵乘GEMM的高性能实现方法.在单核上,使用乘加指令、循环展开、软件流水线指令重排、SIMD向量化运算、寄存器分块技术等与平台架构相关的技术手段,实现汇编级手工优化;在多核上,提出了适用于该平台的多线程加速方案.实验结果显示,在单核串行性能测试中,与知名开源数学库Goto BLAS相比,我们实现了平均4.72倍的加速效果;在多核并行扩展测试中,4线程版的性能则平均达到了单线程版性能的3.02倍.
- 刘昊刘芳芳张鹏杨超杨超
- 关键词:多核
- 一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法
- 本发明提出了一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法,针对国产申威SW1600平台,采用“interface接口‑driver驱动‑kernel汇编核心代码”的三层代码设计框架,使用乘加指...
- 刘昊杨超刘芳芳赵玉文张鹏孙乔
- 文献传递
- 基于Pthreads的并行DSRC压缩算法设计与实现
- 2015年
- 高通量测序仪产生大量的DNA数据,FASTQ是被广泛使用的存储DNA数据的数据格式。对FASTQ格式的数据进行压缩处理,能有效地节省存储空间。DSRC算法具有压缩比高的优点,因此对DSRC算法进行并行能提高压缩FASTQ格式的DNA数据的效率。基于Pthreads,实现了并行DSRC算法。测试结果表明,当使用4线程时加速比达到3.5。
- 詹科张云泉王婷郑晶晶张鹏
- 关键词:数据压缩DSRC
- 一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法
- 本发明提出了一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法,针对国产申威SW1600平台,采用“interface接口?driver驱动?kernel汇编核心代码”的三层代码设计框架,使用乘加指...
- 刘昊杨超刘芳芳赵玉文张鹏孙乔
- 网络优化问题的近似算法
- 新世纪信息技术和软件产业的一个显著的特征是计算机在网络环境中工作,依靠底层的通信链路交换信息.这就自然产生了越来越多的网络优化问题.这些问题通常是大规模的,需要快速求解.许多的网络优化问题被证明是NP难的.然而,我们必须...
- 张鹏
- 关键词:网络优化
- 一种支持关系模型和键-值结构的混合数据存储方法
- 本发明公开了一种支持关系模型和键‑值结构的混合数据存储方法。本方法为:1)根据待处理数据中的实体类别,在关系数据库与键‑值数据库中分别建立多个实体表;2)按照实体数据的属性将该待处理数据分为稳态属性数据和非稳态属性数据;...
- 张鹏王宏安邓昌智吴云坤
- 文献传递
- 一种支持关系模型和键-值结构的混合数据存储方法
- 本发明公开了一种支持关系模型和键-值结构的混合数据存储方法。本方法为:1)根据待处理数据中的实体类别,在关系数据库与键-值数据库中分别建立多个实体表;2)按照实体数据的属性将该待处理数据分为稳态属性数据和非稳态属性数据;...
- 张鹏王宏安邓昌智吴云坤
- 文献传递