您的位置: 专家智库 > >

彭林

作品数:73 被引量:29H指数:3
供职机构:国防科学技术大学更多>>
发文基金:国家高技术研究发展计划国家自然科学基金湖南省教育厅优秀青年基金更多>>
相关领域:自动化与计算机技术文化科学兵器科学与技术军事更多>>

文献类型

  • 55篇专利
  • 12篇期刊文章
  • 4篇会议论文
  • 2篇学位论文

领域

  • 41篇自动化与计算...
  • 2篇文化科学
  • 1篇交通运输工程
  • 1篇军事
  • 1篇兵器科学与技...

主题

  • 18篇处理器
  • 14篇多核
  • 13篇线程
  • 11篇计算机
  • 10篇向量
  • 9篇多核处理
  • 9篇多核处理器
  • 9篇内存
  • 8篇计算机设备
  • 7篇通信
  • 7篇编程
  • 6篇多线程
  • 6篇双精度
  • 6篇结点
  • 6篇函数
  • 6篇并行计算
  • 5篇矩阵
  • 5篇GPU
  • 5篇存储器
  • 4篇代码

机构

  • 73篇国防科学技术...

作者

  • 73篇彭林
  • 58篇黄春
  • 43篇唐滔
  • 32篇方建滨
  • 28篇杨灿群
  • 23篇张鹏
  • 23篇姜浩
  • 22篇左克
  • 13篇杜云飞
  • 13篇范小康
  • 13篇李春江
  • 11篇陈娟
  • 10篇王锋
  • 9篇易会战
  • 9篇赵克佳
  • 8篇苏醒
  • 8篇谢伦国
  • 7篇张小强
  • 6篇廖湘科
  • 5篇陈振邦

传媒

  • 6篇计算机工程与...
  • 3篇计算机科学
  • 2篇计算机研究与...
  • 1篇舰船科学技术
  • 1篇2008年全...
  • 1篇2009年全...
  • 1篇2013全国...

年份

  • 4篇2024
  • 9篇2023
  • 15篇2022
  • 9篇2021
  • 1篇2020
  • 5篇2019
  • 1篇2018
  • 3篇2017
  • 2篇2015
  • 1篇2014
  • 3篇2013
  • 5篇2012
  • 3篇2011
  • 4篇2010
  • 3篇2009
  • 3篇2008
  • 1篇2007
  • 1篇2004
73 条 记 录,以下是 1-10
排序方式:
面向存储层次设计优化的GPU程序性能分析被引量:2
2017年
图形处理器凭借着比传统CPU更高的峰值性能和能效,以及日渐成熟的软件环境,逐渐成为构建异构并行系统的最流行的加速器之一。虽然GPU依靠轻量级线程的灵活切换来隐藏访存延迟,但其超高的并发度仍然给存储系统带来了很大压力,其性能的有效发挥受访存效率的强烈影响。因此GPU程序的访存行为分析及优化一直是GPU相关领域的研究热点,但很少有工作从体系结构的角度分析存储层次的设计对性能的影响。为了更好地指导GPU存储层次的设计和访存优化,从实验的角度详细地分析了GPU各存储层次对程序性能的影响,并总结出若干指导性的优化策略,为未来类似体系结构的存储层次设计和程序优化提供建议。
唐滔彭林黄春杨灿群
关键词:异构系统图形处理器性能分析
基于负载均衡的并行序列比对方法、装置和计算机设备
本申请涉及一种基于负载均衡的并行序列比对方法、装置、计算机设备和存储介质。所述方法包括:通过在集群的每个节点上启动进程,将待比对文件按照文件数据量进行均分,在每个进程上执行等数据量的序列比对,根据集群中进程的编号获取进程...
夏泽宇张昂杨灿群崔英博黄春唐滔彭林方建滨张鹏龙思凡
一种SPH的向量化并行计算方法及装置
本申请涉及一种SPH的向量化并行计算方法、装置、计算机设备和存储介质。所述方法包括:通过将邻近粒子搜索范围内粒子的原始AoS数据重新组织为SoA数据,使得SoA数据符合所使用的SIMD指令集要求,通过SIMD技术的向量化...
杨灿群龙思凡郭晓威范小康李超崔英博黄春唐滔彭林方建滨张鹏夏泽宇
文献传递
面向死锁检查的非阻塞MPI程序符号执行方法、系统及介质
本发明涉及计算机高性能计算的可靠性保证领域,公开了一种面向死锁检查的非阻塞MPI程序符号执行方法、系统及介质。针对非阻塞MPI程序的异步性和非确定性,本发明通过为通信操作的不同消息匹配情况和不同交叠执行情况创建不同待探索...
于恒彪黄春王戟陈振邦傅先进彭林唐滔左克姜浩沈洁方建滨
文献传递
一种基于超越函数加速指令的正余弦函数实现方法及系统
本发明公开了一种基于超越函数加速指令的正余弦函数实现方法及系统,本发明方法包括对传入的向量操作数vd的每个元素规约到[‑π/4,π/4]区间,获得对应的整型向量vql以及位于[‑π/4,π/4]区间内的浮点数向量vdr;...
沈洁龙标黄春彭林唐滔姜浩范小康于恒彪易昕苏醒
阵列异构型计算系统上动态构建软件超结点的方法和装置
本申请涉及一种阵列异构型计算系统上动态构建软件超结点的方法、装置、计算机设备和存储介质。所述方法包括:通过在阵列异构型计算系统中每一个物理结点的后台启动一个守护进程,通过超结点配置进程将每一个物理结点的主机名、结点的身份...
卢凯杨灿群唐滔崔英博黄春彭林方建滨张鹏沈洁姜浩
文献传递
面向投机并行的点点同步算法
线程级投机并行可以利用多核系统的计算能力提高应用程序的性能。串行程序被分割为多个线程并行执行,通过运行时系统保证对包含数据依赖代码按照其串行次序执行。投机成功时,可以极大增加系统并发度,但是投机失败时开销较大。对于一类发...
张小强彭林谢伦国田祖伟
关键词:并行计算机调度程序
文献传递
面向容错的NVM持久化过程冗余信息的压缩方法和装置
本发明公开了一种面向容错的NVM持久化过程冗余信息的压缩方法及装置,本发明实施步骤包括分配写集合、地址队列以及多个值队列,在NVM中分配持久化日志保存区;在事务期间将所有持久化写操作信息写入写集合;扫描写集合,按照值的新...
彭林张文喆陈俊峰黄春唐滔方建滨左克姜浩
文献传递
函数调用栈解析和回溯方法与装置
本申请涉及一种函数调用栈解析和回溯方法及装置,所述方法包括:通过转储异常中断或者手动中断应用程序的执行现场,并根据中断应用程序中终止函数正在执行的代码地址在可执行文件中找到所述终止函数的函数代码,并对处理后的函数代码进行...
张鹏方建滨黄春彭林唐滔崔英博
面向双精度SIMD部件的矩阵乘实现方法
本发明公开了一种面向双精度SIMD部件的矩阵乘实现方法,目的是提高矩阵乘在SIMD部件上的计算速度。技术方案是先增加矩阵B和矩阵C的列数;然后对矩阵A、B进行分块;A的每个分块和对应的B分块使用SIMD部件进行相乘,并将...
杜云飞李春江杨灿群黄春赵克佳易会战陈娟彭林左克
文献传递
共8页<12345678>
聚类工具0