白秀秀
- 作品数:15 被引量:12H指数:2
- 供职机构:西安交通大学更多>>
- 发文基金:国家高技术研究发展计划中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种面向GPU的数据流处理方法
- 本发明公开了一种面向GPU的数据流处理方法,首先,在CPU和GPU组成的异构并行系统中运行待处理的数据密集型计算模块,得到拷入时间Ti、计算时间Tc、拷回时间To;然后,根据三部分运行时间计算如下比例关系:a=Tc/Ti...
- 董小社张保曹海军张兴军冯景华李亮刘超李丹白秀秀刘袁
- 文献传递
- 一种同构平台应用面向CBEA移植的方法
- 本发明公开了一种同构平台应用面向CBEA架构移植的方法,在制定了制导语句规范的基础上,利用剖分级的动态插桩剖分技术,找到整个应用的计算部分,针对该计算核心显式的插入制导语句,通过编译层的源到源编译器,采用“Functio...
- 董小社冯景华冯国富张兴军朱正东李亮刘超白秀秀
- 文献传递
- 一种用于消除存储访问拥塞的同构计算任务分组方法
- 一种用于消除存储访问拥塞的同构计算任务分组方法,该方法依据同构计算任务执行的并行收益进行分组,通过重叠不同分组的计算区域和访存区域,减轻或消除应用在众核处理器系统运行时的存储访问拥塞。本发明不需要在算法层面对是否发生存储...
- 董小社李亮朱正东张兴军巨涛白秀秀颜康
- 面向异构多核架构的自适应编译框架被引量:2
- 2014年
- 针对应用在移植到异构多核高性能计算机系统中所面临的可移植性差以及性能优化难度大的问题,文中提出一种面向异构多核架构的自适应编译框架.通过源到源编译解决传统并行编程模型应用向异构多核架构的映射问题;同时利用动态剖分信息,自适应地调整插桩并配置优化策略,形成迭代式的自动优化过程.文中自适应编译框架将软硬件映射机制与优化策略结合,有效地解决了同构并行应用向异构多核架构的移植问题并提高了应用的整体性能.实验结果表明,文中基于Cell架构实现的原型系统,很好地解决了异构多核架构下应用移植性等问题,同时应用性能有所提高.
- 白秀秀董小社刘超曹海军李亮
- 关键词:异构多核插桩
- 一种基于动态搜索的运行时GPU显存级数据复用优化方法
- 本发明公开了一种基于动态搜索的GPU显存级数据复用优化方法,首先,将已经执行的GPU计算任务的数据访问抽象为动态搜索树的叶子节点,将循环等抽象为搜索树的内部节点;其次,对GPU和CPU计算任务对数据的访问,在运行时逆向回...
- 董小社李亮张兴军颜康张保白秀秀朱正东
- 文献传递
- 一种基于动态搜索的运行时GPU显存级数据复用优化方法
- 本发明公开了一种基于动态搜索的GPU显存级数据复用优化方法,首先,将已经执行的GPU计算任务的数据访问抽象为动态搜索树的叶子节点,将循环等抽象为搜索树的内部节点;其次,对GPU和CPU计算任务对数据的访问,在运行时逆向回...
- 董小社李亮张兴军颜康张保白秀秀朱正东
- 文献传递
- CPU-GPU系统中基于剖分的全局性能优化方法被引量:10
- 2012年
- 针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优化过程划分为访存级、内核加速级和数据划分级3级优化;针对3级优化剖分工具库提供了3级剖分机制,通过运行时的剖分技术获取剖分信息;策略配置模块根据所获取的信息指导用户在每级优化中选择合适的优化策略.实验证明,基于剖分的全局性能优化方法可以明确地指导将应用移植到CPU-GPU异构并行系统上的全局优化过程,利用该优化方法后,以矩阵相乘和傅里叶变换为例的应用性能提升明显,最终性能相对于访存级优化最高可提高30%左右.
- 张保董小社白秀秀曹海军刘超梅一多
- 关键词:全局优化
- 一种用于异构众核系统下的应用程序线程数动态调整方法
- 本发明公开了一种用于异构众核系统下的应用程序线程数动态调整方法,该方法以异构众核硬件架构特征和程序运行时动态阶段性变化的特性为基础,通过采集反映程序性能变化的系统级性能计数器的状态信息,利用预测模型实时估计出最优的线程数...
- 董小社巨涛朱正东李亮白秀秀吴树森魏晓林
- 一种基于频率带的对抗攻击深度神经网络的方法
- 本发明公开了一种基于频率带的对抗攻击深度神经网络的方法,首先获取频率带空间,包括N个方向的频率带对抗干扰,每个方向的频率带对抗干扰包括M个波长的频率带对抗干扰分布;每个频率带对抗干扰分布为包含激活与抑制交替的波形,其波峰...
- 白秀秀刘哲杨明
- 一种面向噪声图像的骨架检测系统及检测方法
- 本发明公开了一种面向噪声图像的骨架检测系统及检测方法,包括多个骨架滤波器,每个骨架滤波器均具有零和性结构及反射对称性结构;多个骨架滤波器分别设置在笛卡尔坐标系的x‑y平面的n个方向,多个骨架滤波器采用旋转对称分布;本发明...
- 白秀秀叶乐乐杨明刘哲