蔡小川
- 作品数:7 被引量:2H指数:1
- 供职机构:中国科学院深圳先进技术研究院更多>>
- 发文基金:中国科学院知识创新工程重要方向项目深圳市基础研究计划项目广东省科技计划工业攻关项目更多>>
- 相关领域:自动化与计算机技术理学交通运输工程机械工程更多>>
- 一种流体力学模拟的方法、装置及存储介质
- 本申请公开了一种流体力学模拟的方法、装置及存储介质,该方法包括:获取流场模型,并生成流场网格;获取基于流场模型而设置的初始宏观信息、边界条件信息和执行进程数量;对流场网格进行划分,以得到对应执行进程数量的多个子区域,并为...
- 徐磊陈荣亮古林燕许文馨闫争争蔡小川
- 文献传递
- 一类求解抛物型PDE的时空并行区域分解算法
- 此文研究一类求解抛物型偏微分方程的并行数值求解算法。能运行于并行计算机集群的传统计算方法是在每个时间步并行求解一个稳态子系统,通过时间推进得到方程的解。当处理器个数增加时,时间推进这个串行过程成为提高并行计算效率的一个瓶...
- 邓小毛蔡小川
- 关键词:对流扩散方程并行计算
- 基于数千核计算平台的汽车外流场可扩展并行数值模拟
- 针对汽车外流场等典型的大雷诺数非定常不可压缩复杂流动,目前主要有二类算法:雷诺时均N-S方程方法,大涡模拟(LES)以及直接数值模拟(DNS)。由于未采用流体流动简化模型,DNS方法能够精确模拟复杂流体的流动,因此可...
- 闰争争陈荣亮赵宇波蔡小川
- 关键词:区域分解算法直接数值模拟N-S方程
- 文献传递网络资源链接
- 基于非结构化网格的高可扩展并行有限体积格子Boltzmann方法
- 2019年
- 均匀网格格子Boltzmann方法虽然有其优势,但是在模拟大规模流场信息以及复杂几何边界时仍然存在困难。为此,文中给出了非结构化网格下的有限体积格子Boltzmann方法。该方法采用cell-centered方案,使用low-diffusion Roe方案计算对流通量密度,通过最小二乘方法计算粒子分布函数的梯度。为了能够模拟大规模复杂流场情况,文中给出了非结构化网格有限体积格子Boltzmann方法的并行方法。该法通过ParMETIS划分流场的非结构化网格,将网格近似平均地发送给MPI进程,比较了两种不同规模的网格单元的并行性能。文中通过以下两点验证了并行算法的正确性:1)顶盖方腔驱动流,Re=400,1 000,3 200,5 000;2)圆柱绕流,Re=10,20,40。并行数值实验的结果表明所提并行算法在1 920核上仍然拥有良好的可扩展性,在1 920个核上的并行效率可以达到在240核上效率的78.42%。
- 徐磊陈荣亮蔡小川
- 关键词:非结构化网格并行计算
- 一种求解汽车外流场问题的可扩展数值算法
- 2015年
- 受外型复杂、雷诺数高等因素影响,汽车外流场流动的数值计算规模巨大且难以精确求解。发展高效并行算法以利用超级计算平台资源来数值求解外流问题成为该领域的研究热点。文章提出一种全隐格式的可扩展并行Newton-Krylov-Schwarz算法对某真实汽车的外流场流动问题进行计算。通过与风洞试验以及主流计算流体力学软件的计算结果对比验证了算法的正确性。并行数值计算结果显示,文章的算法在数千处理器规模下仍具有很好的并行可扩展性。
- 闫争争陈荣亮赵宇波蔡小川
- 关键词:NAVIER-STOKES方程并行计算区域分解算法
- 一种流体力学模拟的方法、装置及存储介质
- 本申请公开了一种流体力学模拟的方法、装置及存储介质,该方法包括:获取流场模型,并生成流场网格;获取基于流场模型而设置的初始宏观信息、边界条件信息和执行进程数量;对流场网格进行划分,以得到对应执行进程数量的多个子区域,并为...
- 徐磊陈荣亮古林燕许文馨闫争争蔡小川
- CPU/GPU集群上求解偏微分方程的可扩展混合算法被引量:2
- 2012年
- 当前世界上排前几位的超级计算机都基于大量CPU和GPU组合的混合架构,它们对某些特殊问题,譬如基于FFT的图像处理或N体颗粒计算等领域可获得很高的性能。但是对由有限差分(或基于网格的有限元)离散的偏微分方程问题,于CPU/GPU集群上获得较好的性能仍然是一种挑战。本文提出并测试一种基于这类集群架构的混合算法。算法的可扩展性通过区域分解算法实现,而GPU的性能由基于光滑聚集的代数多重网格法获得,避免了在GPU上表现不理想的不完全分解算法。本文的数值实验采用32CPU/GPU求解用差分离散后达三千万未知数的偏微分方程。
- 罗力杨超赵宇波蔡小川
- 关键词:PDES