巨涛
- 作品数:8 被引量:14H指数:1
- 供职机构:西安交通大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种用于消除存储访问拥塞的同构计算任务分组方法
- 一种用于消除存储访问拥塞的同构计算任务分组方法,该方法依据同构计算任务执行的并行收益进行分组,通过重叠不同分组的计算区域和访存区域,减轻或消除应用在众核处理器系统运行时的存储访问拥塞。本发明不需要在算法层面对是否发生存储...
- 董小社李亮朱正东张兴军巨涛白秀秀颜康
- 一种用于众核系统的数据相关性线程分组映射方法
- 本发明公开了一种用于众核系统的线程数据相关性分组映射方法,该方法通过计算数据重用距离分析应用程序线程内部数据局部性,用线程相关性矩阵度量不同线程间的数据相关性;根据应用程序的数据相关性及众核处理器架构特点,利用最小生成树...
- 董小社巨涛张兴军陈衡党博超吴树森
- 文献传递
- 一种用于众核系统的数据相关性线程分组映射方法
- 本发明公开了一种用于众核系统的线程数据相关性分组映射方法,该方法通过计算数据重用距离分析应用程序线程内部数据局部性,用线程相关性矩阵度量不同线程间的数据相关性;根据应用程序的数据相关性及众核处理器架构特点,利用最小生成树...
- 董小社巨涛张兴军陈衡党博超吴树森
- 一种用于异构众核系统下的应用程序线程数动态调整方法
- 本发明公开了一种用于异构众核系统下的应用程序线程数动态调整方法,该方法以异构众核硬件架构特征和程序运行时动态阶段性变化的特性为基础,通过采集反映程序性能变化的系统级性能计数器的状态信息,利用预测模型实时估计出最优的线程数...
- 董小社巨涛朱正东李亮白秀秀吴树森魏晓林
- 一种用于异构众核系统下的应用程序线程数动态调整方法
- 本发明公开了一种用于异构众核系统下的应用程序线程数动态调整方法,该方法以异构众核硬件架构特征和程序运行时动态阶段性变化的特性为基础,通过采集反映程序性能变化的系统级性能计数器的状态信息,利用预测模型实时估计出最优的线程数...
- 董小社巨涛朱正东李亮白秀秀吴树森魏晓林
- 文献传递
- 面向众核系统的线程分组映射方法被引量:1
- 2016年
- 为了使应用线程更合理地映射到众核处理器具体处理核上,提出一种利用不同线程内部数据局部性及不同线程间数据相关性的特点、结合具体硬件架构特征的线程分组映射方法。通过计算数据重用距离,分析应用程序线程内部数据局部性,用线程相关性矩阵度量不同线程间的数据相关性;根据应用程序数据相关性及众核处理器硬件架构特点,通过设计数据相关性子树生成算法,将应用线程分为能反映不同线程数据访问特点的逻辑组;在线程逻辑分组的基础上,通过线程到处理核的绑定实现线程到具体处理器不同处理核硬件线程的合理映射。实验结果表明:与传统映射方法相比,该线程分组映射方法在不产生额外运行时开销的基础上,计算性能平均提高了14%,能耗降低了12%。该方法可以根据应用程序不同线程之间的数据相关性,将不同线程合理映射到具体众核处理器不同处理核上,在不引入额外运行时开销的基础上,提升众核系统的计算效能。
- 巨涛张兴军陈衡董小社
- 关键词:数据相关性
- 一种用于消除存储访问拥塞的同构计算任务分组方法
- 一种用于消除存储访问拥塞的同构计算任务分组方法,该方法依据同构计算任务执行的并行收益进行分组,通过重叠不同分组的计算区域和访存区域,减轻或消除应用在众核处理器系统运行时的存储访问拥塞。本发明不需要在算法层面对是否发生存储...
- 董小社李亮朱正东张兴军巨涛白秀秀颜康
- 文献传递
- 异构众核系统及其编程模型与性能优化技术研究综述被引量:13
- 2015年
- 异构众核系统已成为当前高性能计算领域重要的发展趋势.针对异构众核系统,从架构、编程、所支持的应用三方面分析对比当前不同异构系统的特点,揭示了异构系统的发展趋势及异构系统相对于传统多核并行系统的优势;然后从编程模型和性能优化方面分析了异构系统存在的问题和面临的挑战,以及国内外研究现状,结合当前研究存在的问题和难点,探讨了该领域进一步深入的研究方向;同时对两种典型的异构众核系统CPU+GPU和CPU+MIC进行不同应用类型的Benchmark测试,验证了两种异构系统不同的应用特点,为用户选择具体异构系统提供参考,在此基础上提出将两种众核处理器(GPU和MIC)结合在一个计算节点内构成新型混合异构系统;该新型混合异构系统可以利用两种众核处理器不同的处理优势,协同处理具有不同应用特点的复杂应用,同时分析了在该混合异构系统下必须要研究和解决的关键问题;最后对异构众核系统面临的挑战和进一步的研究方向进行了总结和展望.
- 巨涛朱正东董小社
- 关键词:异构计算编程模型