李春江
- 作品数:53 被引量:93H指数:5
- 供职机构:国防科学技术大学计算机学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家杰出青年科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 多线程交叉双精度短向量结构的评测激励自动构造方法
- 本发明公开了一种多线程交叉双精度短向量结构的评测激励自动构造方法,包括步骤:输入待评测的向量操作类型和向量长度;自动创建一内容为空的用作评测激励的汇编语言文件;向汇编语言文件中写入如下内容:多线程运行初始化代码段、评测激...
- 李春江杜云飞易会战杨灿群黄春陈娟赵克佳王锋彭林左克
- 文献传递
- 一种基于CPU和GPU协作的分子动力学加速方法
- 本发明公开了一种基于CPU和GPU协作的分子动力学加速方法,目的是提出一种通过协同使用CPU和GPU的加速方法,在较低成本的情况下实现分子动力学的加速。技术方案是使用配置有多核CPU和GPU的计算机,对待模拟的分子系统建...
- 廖湘科杨灿群吴强陈娟李春江杜云飞彭林左克石志才
- 文献传递
- 主从式单边异构多核处理器编程模型和编译架构被引量:2
- 2009年
- 主从式单边异构体系结构的异构多核处理器广泛应用于面向专门应用领域的计算加速,如异构多核嵌入式处理器、DSP、SoC等;高性能的该类处理器也可用于一些大规模科学和工程计算问题的处理。主从式单边异构处理器对编程模型和编译技术提出了很多挑战性问题,如编程模型的选择、编程语言的设计、编译器架构设计以及运行库的设计等。本文分析了这一类处理器结构特点和执行模型,认为功能卸载模型是最适用于这一体系结构的编程模型;并分析了面向功能卸载模型的编程语言设计关键问题,提出了编译系统的架构,讨论了相应的运行库设计问题。
- 李春江杨学军
- 关键词:多核编程模型
- 计算网格应用可用性的度量模型被引量:15
- 2003年
- 计算网格是很容易变化的不可靠的计算环境 ,因此如何保证应用的可用性成为构建网格系统的关键问题之一 ,而首先要解决的问题是如何对计算网格的可用性进行度量 分析了计算网格可用性的特征 ,提出从应用的角度度量计算网格可用性的方法 ,并设计了一种度量计算网格中应用可用性的模型 在这一模型中 ,应用的可用性用一个串行RBD来描述 ,每个网格结点上运行的应用的任务的可用性用概率模型描述 以此模型为基础 ,首先分析了在计算网格中影响应用可用性的关键因素 。
- 李春江李东升肖侬杨学军
- 关键词:可用性分析
- 基于Imagine的科学程序局部性优化方法被引量:1
- 2007年
- 基于Imagine体系结构,提出了一种科学程序局部性优化方法,旨在提高流程序的带宽利用率并保证Imagine强大的计算能力.关键技术在于通过对循环的计算变换和数据变换来开发体系结构的优势.对4个典型科学程序的实验表明,该优化能够有效地提高程序计算密集性且减少索引流,从而增强程序的局部性.
- 杜静贾佳杨学军杨灿群李春江
- 关键词:IMAGINE
- 双精度SIMD部件芯片级验证测试激励自动生成方法
- 本发明公开了一种双精度SIMD部件芯片级验证测试激励自动生成方法,目的是提出一种自动生成双精度SIMD部件芯片级验证测试激励的方法。技术方案为:先根据所要验证的双精度数据运算类型以及数组长度scale,构造进行双精度数组...
- 李春江易会战赵克佳杨灿群黄春王锋杜云飞陈娟彭林
- 文献传递
- 片上Cache网络中基于位置感知的数据预取方法
- 本发明公开一种片上Cache网络中基于位置感知的数据预取方法,步骤包括:1)在处理器启动后,利用数据位置向量表记录被取入处理器上片上Cache网络中的数据在片上Cache网络中的Cache块信息;2)当处理器核在执行到程...
- 杨灿群李春江王锋黄春杜云飞彭林左克李宽姜浩
- 面向ARM64架构多核微处理器的模板计算性能优化研究被引量:3
- 2017年
- 模板计算是一类重要的计算核心,广泛存在于图像和视频处理以及大规模科学和工程计算领域。但是,针对ARM64高性能处理器的模板计算性能的优化研究还很少。为了实现典型模板计算核心在ARM64架构多核微处理器上的并行化和性能优化,基于AMCC X-GENE2和飞腾FT-1500A多核微处理器特点,提出了基于两维度绑定的优化方法,该方法通过线程与CPU绑定以及线程与数据块绑定,减少了线程调度的并行开销,增加了Cache的命中率。实验结果表明,该方法提升了模板计算在ARM64架构多核微处理器上的性能,且在两种ARM64架构多核微处理器平台上都表现出较好的可扩展性。
- 冯璐霞李春江黄亚斌
- 关键词:并行化
- GCC编译器中编译指导的自动向量化实现被引量:2
- 2014年
- 基于编译指导的自动向量化已经成为编译器开发SIMD体系结构性能潜力的必然选择。OpenMP 4.0规范新增了SIMD编译指导语句,在开发中的GCC 4.9版本已经开始着手支持OpenMP4.0规范。详细分析了SIMD编译指导在GCC 4.9中的实现情况,重点分析了SIMD编译指导在编译器自动向量化阶段的影响,这为改进GCC的现有实现和提高向量化能力提供了有价值的参考。
- 徐颖李春江董钰山周思齐
- 关键词:GCCSIMD自动向量化
- 一种基于共享内存实现多进程共享GPU的方法
- 本发明公开了一种基于共享内存实现多进程共享GPU的方法,目的是解决单个异构计算结点上SPMD程序的多个进程之间不能共享使用GPU的问题。技术方案是启动GPU服务端,GPU服务端等待GPU客户端请求信号的到来。启动GPU客...
- 杜云飞杨灿群易会战王锋黄春赵克佳陈娟李春江左克彭林
- 文献传递