中国科学院数学与系统科学研究院期刊网

2025年, 第46卷, 第4期 刊出日期:2025-12-14
  

  • 全选
    |
    论文
  • 徐小文
    数值计算与计算机应用. 2025, 46(4): 263-264. https://doi.org/10.12288/szjs.2025.4.263
    CSTR: 32034.14.szjs.s2025.4.263
    摘要 ( ) PDF全文 ( )   可视化   收藏
    数值线性代数解法器是科学工程计算与工业软件的核心组件,也是影响这些软件计算效率的主要瓶颈,其高效算法设计与性能优化面临复杂应用特征与超级计算机体系结构特征的双重挑战,一直以来都是学术界和工业界广受关注的问题。自2018年开始,国内相关专家发起并组织了解法器快速算法及应用研讨会(Solver会议),该系列会议至今已成功举办了8届,已成为国内该领域研究人员发布研究成果的交流平台,吸引了工业界和实际应用部门的广泛关注。本系列专辑拟邀请Solver会议组织者担任客座编委,不定期组织活跃于该会议的专家和团队,围绕数值代数解法器的快速算法设计、性能优化、自主软件研发和实际应用撰写文章,展示该领域的最新进展,促进该领域在我国的发展。

    本专辑由北京应用物理与计算数学研究所徐小文研究员等人(编委名单见后)负责组织,经过严格同行评审,最终录用了8篇文章,涵盖了自主解法器软件与算法库、应用驱动快速算法、面向国产处理器的性能优化、新型算法等主题,一定程度上反映了我国近年来该领域的研究进展。
  • 王紫菁, 郭昭彤, 刘昊宸, 谢和虎
    数值计算与计算机应用. 2025, 46(4): 265-282. https://doi.org/10.12288/szjs.s2025-1037
    CSTR: 32034.14.szjs.s2025-1037
    摘要 ( ) PDF全文 ( )   可视化   收藏
    大规模代数特征值问题广泛应用于材料科学与工程结构分析等领域. 在多尺度复杂系统中, 随着问题规模的不断扩大以及尺度差异引发的误差累积, 传统特征值算法在精度、稳定性以及计算效率方面逐渐显现不足, 在部分场景下甚至难以实现有效求解. 本文围绕特征值解法器GCGE的研究进展, 系统开展了高效并行算法的设计与实现, 致力于提升其在复杂系统中的稳定性与适应性. 针对传统解法器在处理复杂小规模问题及大规模病态问题时存在的效率与稳定性瓶颈, 本文对GCG算法进行了优化改进, 引入对角归一化预处理策略以增强收敛性和数值稳定性, 并提出面向质量矩阵不正定问题的$L^2$-正交与刚度矩阵正交策略以提升数值性能. 此外, GCGE已完成与SLEPc软件环境的集成, 支持Hermitian特征值问题和最大特征值问题的求解, 并在北太天元高性能计算平台实现模块化部署, 展现出良好的工程应用前景.
  • 贾朝蓬, 宗毅, 张晨松, 孙健, 牟龙江, 王建春, 徐小文, 王欣亮, 于沛楠, 薛巍
    数值计算与计算机应用. 2025, 46(4): 283-295. https://doi.org/10.12288/szjs.s2025-1046
    CSTR: 32034.14.szjs.s2025-1046
    摘要 ( ) PDF全文 ( )   可视化   收藏
    代数多重网格(AMG)是一种高效的线性方程组求解预条件方法.半结构 AMG 利用结构化信息高效计算, 且支持存在非结构信息, 因此可以同时达到高性能和高灵活性, 从而广泛应用于科学与工程计算的各个场景中.然而, 目前主流半结构 AMG 求解器在绝对速度和可扩展性上仍然具有明显缺陷, 为此我们研发了 Semi-StructMG 求解器. 一方面, 它利用多维粗化, 降低了复杂度, 提高了单步运行速度和可扩展性; 另一方面, 它在光滑器和插值算子中考虑块间连边, 改善了在各种复杂问题中的收敛性.我们在基准测试和多个真实应用中对 Semi-StructMG 进行了测试, 相比 hypre 中的 SSAMG, Split 和 BoomerAMG 达到了 5.97x, 15.2x 和 3.85x 的加速比.
  • 汪云婷, 杨少峰, 何鑫, 谭光明
    数值计算与计算机应用. 2025, 46(4): 296-320. https://doi.org/10.12288/szjs.s2025-1047
    CSTR: 32034.14.szjs.s2025-1047
    摘要 ( ) PDF全文 ( )   可视化   收藏
    线性方程组解法器库X-Solver旨在实现并优化Krylov子空间求解方法与预条件算法,用于在配备GPU加速卡的分布式内存机群上高效求解大规模稀疏线性方程组. 结合实际应用需求与硬件架构趋势,我们在以下三个方面实现了突破: (1) 提供用户友好、易于集成的分布式计算支持; (2) 深度适配异构架构特征,充分挖掘硬件计算潜力; (3) 保持跨多种硬件平台的高性能可移植性. 数值实验表明,在目标硬件上,X-Solver相较于其它先进解法器库在多个典型应用中展现出优势.
  • 赵梨, 李研研, 王宝华, 张晨松
    数值计算与计算机应用. 2025, 46(4): 321-345. https://doi.org/10.12288/szjs.s2025-1041
    CSTR: 32034.14.szjs.s2025-1041
    摘要 ( ) PDF全文 ( )   可视化   收藏
    整体代数多重网格(BAMG)法是一种求解偏微分方程组离散系统的高效预条件方法, 可用于求解多孔介质中的多相渗流模型. 本文针对BAMG方法, 面向多相多组分油气藏问题研究了块矩阵粗化中不同范数的选取及基于对角块的经典插值策略对收敛性的影响. 针对启动阶段的并行瓶颈, 引入了"延迟更新"和"结构保持更新"两种策略, 并基于可容忍迭代增长阈值的判据设计了一种自适应启动BAMG预条件方法. 进一步, 对求解阶段中的磨光算子与残量计算等热点进行了深度优化与向量化. 数值实验表明, 所提出方法在收敛性、高效性及并行可扩展性方面具有优势; 例如, 在亿级网格规模的测试中, 当使用8192个CPU核时, 提出方法的计算时间相比于传统方法减少了57.6%, 并行效率提升了38.1%.
  • 岳孝强, 王毅扬, 潘先云
    数值计算与计算机应用. 2025, 46(4): 346-370. https://doi.org/10.12288/szjs.s2025-1029
    CSTR: 32034.14.szjs.s2025-1029
    摘要 ( ) PDF全文 ( )   可视化   收藏
    三温辐射扩散方程组能够准确地描述辐射能量在介质中传播、散射、吸收和发射等物理过程.文[Yue X, He J, Xu X, Shu S, Wang L. Commun. Comput. Phys., 2022, 32: 829-849]基于一种物理量重叠分解策略提出了精确限制型加性和乘性Schwarz预条件算法和迭代算法,但未给出相关收敛性支撑和数值验证.本文将为它们所含的Schur补矩阵中子块逆矩阵提出合理的逼近假设,据此构造相应的非精确限制型加性和乘性Schwarz预条件算法,并受范数等价和数值域等价的数学启发,在保对称有限体元离散格式(或其系数矩阵)的稳定性条件下,开展相应预处理广义极小残差迭代方法的最优收敛性分析,且通过源自激光驱动球形内爆减速阶段中流体动力学不稳定实际模拟实验证实理论结果的有效性.
  • 何剑萌, 舒适, 魏杰, 岳孝强
    数值计算与计算机应用. 2025, 46(4): 371-385. https://doi.org/10.12288/szjs.s2025-1043
    CSTR: 32034.14.szjs.s2025-1043
    摘要 ( ) PDF全文 ( )   可视化   收藏
    辐射扩散问题广泛出现在天体物理学和惯性约束聚变等多物理耦合领域, 基于问题的物理与代数特征的 AMG 法已成为当今多重网格法研究领域的热点.本文重点针对三温辐射扩散方程组的线性化离散系统, 首先给出了一种常见的 UA-AMG 预条件算法及相应的 PGMRES 解法器 T2T2-ILU(0)-V-FGMRES. 进一步, 为改善该解法器的计算性能, 对不同离散系统凝练了若干物理和代数特征, 设计了基于这些特征的自适应 UA-AMG 预条件算法, 并研制了相应的 PGMRES 解法器 Adapt-UA-AMG-FGMRES. 数值实验表明: 新解法器具有更好的稳健性和计算效率, 与解法器 T2T2-ILU(0)-V-FGMRES 和 HMIS-V-FGMRES(在基于几种常见非聚集型粗化算法的 AMG 预条件子中计算性能最好)相比 CPU 时间分别减少了约 49.1% 和 25.3%.上述算法设计思想容易推广到多群辐射扩散方程组等更一般的模型问题中.
  • 张思为, 李军贤, 李易达, 刘伟峰
    数值计算与计算机应用. 2025, 46(4): 386-397. https://doi.org/10.12288/szjs.s2025-1048
    CSTR: 32034.14.szjs.s2025-1048
    摘要 ( ) PDF全文 ( )   可视化   收藏
    在大规模线性系统求解中, 传统稀疏直接法解法器往往采用单一精度计算方式, 难以灵活平衡计算效率与数值精度. 为解决该问题, 基于分布式稀疏直接法解法器PanguLU提出了一种面向异构众核处理器MT-3000的混合精度优化算法. 该算法依据矩阵块的空间位置与数值敏感性, 动态选择块存储精度, 从而在数值分解阶段实现混合精度计算. 同时, 针对解法器中的通用矩阵乘子任务, 设计了一种计算与存储精度分离的流水线机制. 实验结果表明, 所提出的方法在数值分解阶段实现了1.04倍至1.19倍的性能提升, 同时将相对残差较单精度方案降低了1.97倍至4.15倍, 在提升求解速度的同时有效控制了精度损失.
  • 杜皓, 徐小文
    数值计算与计算机应用. 2025, 46(4): 398-410. https://doi.org/10.12288/szjs.s2025-1067
    CSTR: 32034.14.szjs.s2025-1067
    摘要 ( ) PDF全文 ( )   可视化   收藏
    随机算法近年来发展迅速, 展现出实际应用潜力, 为大规模线性代数方程组的求解提供了新的技术途径. 本文综述稀疏线性代数方程组随机算法的研究现状, 对当前主要的三类随机算法进行了总结, 分析了这些算法的特点、计算复杂度和面临的问题. 在此基础上, 本文对当前随机算法的研究现状进行了评估, 指出了离实际应用需求的差距, 对面向大规模实际应用的随机算法研究进行了展望.