聂宁明, 姚柯寒, 曾艳, 冯仰德, 王珏, 李顺德, 张纪林, 万健, 林克豪, 高岳, 王彦棡, 王宗国
本文结合大规模撕裂有限元方法和Newmark积分法, 对结构动力学问题进行高精细的大规模并行求解.面向异构平台, 设计了结点间和结点内的多级动静结合的负载均衡策略.在结点间, 根据撕裂有限元方法划分子域边界特点, 采用域边界平衡的图二分算法, 均衡各个子域的计算量;在结点内, 根据异构平台计算单元的性能差异, 进行了计算负载的动态优化.针对核心计算模块批量矩阵向量乘进行多流并行优化, 提升面向异构计算平台的利用率.本文优化已经集成到结构力学高性能数值模拟软件HARSA-feti中, 实验采用真实反应堆核燃料组件的流致振动仿真作为算例, 结果表明模拟性能提高了71.3%以上, 首次实现了百亿网格规模的全堆芯燃料棒组件的高精细模拟, 相较于1000块GPU, 16000 块GPU 的强、弱可扩展并行效率分别达到74.1%和81.1%.