唐滔
- 作品数:82 被引量:81H指数:5
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
- 相关领域:自动化与计算机技术文化科学电子电信理学更多>>
- 一种基于转置的向量三角函数快速查表方法及系统
- 本发明公开了一种基于转置的向量三角函数快速查表方法及系统,本发明方法包括:输入索引向量vi与基址地址pb,将索引向量vi保存的偏移量值拆分到标量中,并与基址地址pb相加得到VL个地址,使用向量加载指令将VL个地址处共VL...
- 沈洁龙标黄春唐滔彭林方建滨崔英博张鹏廖霞
- Jacobi和Laplace算法在GPU平台上的设计与实现被引量:5
- 2009年
- 随着半导体工艺的发展,GPU的浮点计算能力迅速提高。如何把GPU处理技术应用到非图形计算领域成为体系结构以及高性能计算领域的热点研究问题。Jacobi和Laplace是科学计算领域常用的计算核心。本文基于AMD的流处理GPU平台设计并实现了这两个算法,相对于CPU平台取得了很好的加速效果。
- 唐滔林一松
- 关键词:GPU
- 一种基于MPI并行的SPH程序加速方法及装置
- 本发明涉及光滑粒子动力学领域,公开了一种基于MPI并行的SPH程序加速方法及装置,本发明对空间中的求解域划分获得预设数量子区域,将子区域分配给处理器;处理器中对子区域进行配置并确定处理器边界数值;在处理器进行并行邻近粒子...
- 杨灿群龙思凡葛振郭晓威范小康李超唐滔崔英博
- 一种面向多物理场应用的分离式耦合数值模拟方法和装置
- 本申请涉及一种面向多物理场应用的分离式耦合数值模拟方法和装置。所述方法包括:在流‑固耦合的多物理场应用的数值模拟中,通过格子玻尔兹曼法求解流体区域,有限体积法求解固体区域,采用开源耦合库提供的一致性数据映射方案对耦合区域...
- 杨灿群刘毅郭晓威李超唐滔范小康张森
- 一种SPH的向量化并行计算方法及装置
- 本申请涉及一种SPH的向量化并行计算方法、装置、计算机设备和存储介质。所述方法包括:通过将邻近粒子搜索范围内粒子的原始AoS数据重新组织为SoA数据,使得SoA数据符合所使用的SIMD指令集要求,通过SIMD技术的向量化...
- 杨灿群龙思凡郭晓威范小康李超崔英博黄春唐滔彭林方建滨张鹏夏泽宇
- 文献传递
- 面向死锁检查的非阻塞MPI程序符号执行方法、系统及介质
- 本发明涉及计算机高性能计算的可靠性保证领域,公开了一种面向死锁检查的非阻塞MPI程序符号执行方法、系统及介质。针对非阻塞MPI程序的异步性和非确定性,本发明通过为通信操作的不同消息匹配情况和不同交叠执行情况创建不同待探索...
- 于恒彪黄春王戟陈振邦傅先进彭林唐滔左克姜浩沈洁方建滨
- 文献传递
- 一种基于无误差变换的计算编译优化实现方法及系统
- 本发明公开了基于无误差变换的计算编译优化实现方法及系统,本发明方法包括将待优化程序源代码通过LLVM编译器转换成程序初始位码文件;将初始位码文件中的信息利用搜索工具获取初始位码文件中的信息,形成初始变量精度配置文件和待搜...
- 姜浩周一帆苏醒黄春唐滔易昕鲁轻风陈磊漆海俊
- 一种面向CPU-GPU异构系统的容错方法被引量:6
- 2011年
- 近年来,为了缓解日益严重的功耗问题,异构并行体系结构已成为超级计算机发展的一个重要趋势.图形处理器(graphics processing unit,简称GPU)凭借其超高的计算性能和性能功耗比,作为一种高效的加速部件已被广泛应用于高性能计算领域.但是,GPU先天的可靠性缺陷势必加剧超级计算机的可靠性问题.目前,国际上关于CPU-GPU异构系统容错技术的研究工作主要将GPU从异构系统中独立出来,以每次调用为粒度对其进行容错处理.设计了一种面向CPU-GPU异构系统的Lazy容错方法,给出了基于编译指导命令的容错框架及其约束,并讨论了相关的编译实现和优化方法,最后通过实验验证了该方法的正确性.实验结果表明,与现有的容错方法相比,利用所设计的LazyFT容错方法对GPGPU(general purpose computation on graphics hardware)程序进行容错处理,可以明显降低容错代价.
- 徐新海杨学军林宇斐林一松唐滔
- 关键词:GPGPU异构系统容错检查点
- 一种基于超越函数加速指令的正余弦函数实现方法及系统
- 本发明公开了一种基于超越函数加速指令的正余弦函数实现方法及系统,本发明方法包括对传入的向量操作数vd的每个元素规约到[‑π/4,π/4]区间,获得对应的整型向量vql以及位于[‑π/4,π/4]区间内的浮点数向量vdr;...
- 沈洁龙标黄春彭林唐滔姜浩范小康于恒彪易昕苏醒
- 稀疏矩阵向量乘并行任务粒度参数自动调优方法和装置
- 本发明属于并行计算领域,公开了一种稀疏矩阵向量乘并行任务粒度参数的自动调优方法和装置,其方法包括预测模型构建步骤,使用机器学习的方法构建预测模型;统计特征取值获取步骤,对矩阵原始数据文件进行分析,获取矩阵的统计特征取值;...
- 方建滨黄春唐滔彭林张鹏范小康崔英博
- 文献传递