您的位置: 专家智库 > >

黄亚斌

作品数:2 被引量:3H指数:1
供职机构:国防科学技术大学计算机学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇会议论文

领域

  • 2篇自动化与计算...

主题

  • 1篇多核
  • 1篇多核微处理器
  • 1篇掩码
  • 1篇微处理器
  • 1篇线程
  • 1篇向量
  • 1篇架构
  • 1篇绑定
  • 1篇SIMD
  • 1篇LLVM
  • 1篇并行化
  • 1篇处理器
  • 1篇存取
  • 1篇FT

机构

  • 2篇国防科学技术...

作者

  • 2篇李春江
  • 2篇黄亚斌

传媒

  • 1篇计算机工程与...

年份

  • 1篇2017
  • 1篇2016
2 条 记 录,以下是 1-2
排序方式:
面向ARM64架构多核微处理器的模板计算性能优化研究被引量:3
2017年
模板计算是一类重要的计算核心,广泛存在于图像和视频处理以及大规模科学和工程计算领域。但是,针对ARM64高性能处理器的模板计算性能的优化研究还很少。为了实现典型模板计算核心在ARM64架构多核微处理器上的并行化和性能优化,基于AMCC X-GENE2和飞腾FT-1500A多核微处理器特点,提出了基于两维度绑定的优化方法,该方法通过线程与CPU绑定以及线程与数据块绑定,减少了线程调度的并行开销,增加了Cache的命中率。实验结果表明,该方法提升了模板计算在ARM64架构多核微处理器上的性能,且在两种ARM64架构多核微处理器平台上都表现出较好的可扩展性。
冯璐霞李春江黄亚斌
关键词:并行化
基于LLVM实现尾循环向量化
SIMD体系结构呈现向量长度越来越长的发展趋势,允许同时以向量方式处理更多的数据;但是,循环向量化会产生更多的循环尾部指令无法向量化。为了更有效地利用SIMD,本文提出了尾循环向量化方法,通过掩码存取访问内存数据和向量填...
黄亚斌李春江冯璐霞
关键词:SIMDLLVM
文献传递
共1页<1>
聚类工具0