中国科学院数学与系统科学研究院期刊网

数值计算与计算机应用 2022年 43卷

Please wait a minute...
选择: 显示/隐藏图片
1. 油藏数值模拟中的线性解法器
张晨松
数值计算与计算机应用    2022, 43 (1): 1-26.   DOI: 10.12288/szjs.s2021-0813
摘要963)      PDF(pc) (2604KB)(687)    收藏
中国的含油气地层分布广泛,但地质结构复杂,天然能量不足,开采难度高.油藏数值模拟方法与软件是油藏工程师对油藏进行分析和管理的重要工具,是油气藏开发后期确定剩余油分布、挖掘生产潜力和提高采收率的主要手段之一.精细地质模型可以达到很高的空间分辨率,导致网格数目巨大,模拟难度大、代价高,这给数值算法研究带来很多新挑战.本文以一个简化组分模型为例,简单介绍了其数学模型、离散方法、求解方法、并行计算和软件实现,其中着重介绍了几种被工业级软件采用的预条件方法和解耦方法.
参考文献 | 相关文章 | 多维度评价
2. 脉冲微分混沌系统动力学数值模拟与分析
郭俊荣, 严平
数值计算与计算机应用    2022, 43 (1): 27-37.   DOI: 10.12288/szjs.s2020-0683
摘要325)      PDF(pc) (2173KB)(129)    收藏
由于脉冲微分混沌系统具有复杂的性态,在理论分析时具有一定的难度,而数值分析在一定程度上可以提供一些指导,所以数值模拟方法成为脉冲微分混沌系统研究的重要手段.该文设计了脉冲微分混沌系统的动力学分析算法,并将数值解以可视化的形式展现,绘制出方程组解的相图、分岔图、Poincaré截面.以具有Holling typeⅡ功能反应函数的Gompertz病毒传染病模型为例验证算法的可行性,进行了数值模拟,得到了一些有意义的结论.
参考文献 | 相关文章 | 多维度评价
3. 基于对偶交替方向乘子法求解罚分位数回归问题
赵宁宁, 王承竞
数值计算与计算机应用    2022, 43 (1): 38-48.   DOI: 10.12288/szjs.s2020-0698
摘要265)      PDF(pc) (466KB)(130)    收藏
分位数回归是对数据进行分析与预测的有效方法.由于分位数回归的损失函数具有非光滑性,有关分位数回归的计算问题仍面临着一些挑战.本文通过从罚分位数回归的对偶问题出发基于交替方向乘子法(Alternating Direction Method of Multipliers,简称ADMM)求解罚分位数回归问题.并在一些温和的条件下,给出对偶交替方向乘子法(dual ADMM,简称dADMM)的全局收敛性及局部线性收敛速度.数值试验验证了该算法的有效性.
参考文献 | 相关文章 | 多维度评价
4. 求解随机常微分方程的平均单支$\theta-$方法
何鼎, 胡鹏
数值计算与计算机应用    2022, 43 (1): 49-60.   DOI: 10.12288/szjs.s2020-0703
摘要217)      PDF(pc) (388KB)(111)    收藏
本文针对随机常微分方程(Random ordinary differential equations)的路径近似提出了平均单支$\theta$-方法.在单边Lipschitz条件下,得到该方法的路径收敛性,并研究了此类方法的B-稳定性,证明当$\theta\in[\frac{1}{2},1]$,方法是B-稳定的.最后,{数值实验}验证了本文的结论.
参考文献 | 相关文章 | 多维度评价
5. 基于均值修正的Toeplitz矩阵填充的增广拉格朗日乘子算法
温瑞萍, 肖云, 王川龙
数值计算与计算机应用    2022, 43 (1): 61-75.   DOI: 10.12288/szjs.s2020-0706
摘要237)      PDF(pc) (561KB)(147)    收藏
本文基于均值的增广拉格朗日乘子算法,提出了一种快速且具有较高精度的Toeplitz矩阵填充算法.新算法一方面通过均值结构化处理保证迭代后产生的填充矩阵是可行的Toeplitz矩阵,另一方面通过在迭代过程中嵌入修正步而极大地节约了计算时间,得到了更精确的填充矩阵.同时讨论了新算法的收敛性,最后通过数值实验表明新算法比基于均值的增广Lagrange乘子算法(MALM)和增广Lagrange乘子算法(ALM)在时间和精度上均有改进.
参考文献 | 相关文章 | 多维度评价
6. 粘性Burgers方程的高阶精度半隐式WCNS方法
陈勋, 蒋艳群, 陈琦, 张旭, 胡迎港
数值计算与计算机应用    2022, 43 (1): 76-87.   DOI: 10.12288/szjs.s2020-0710
摘要450)      PDF(pc) (1039KB)(136)    收藏
Burgers方程为Navier-Stokes方程组的简化形式,在计算数学和计算流体力学领域中有着广泛应用.本文设计了粘性Burgers方程的高阶精度半隐式加权紧致非线性格式(WCNS),并给出了稳定性分析.方程对流项和粘性项分别采用五阶精度WCNS格式和四阶中心差分格式计算.半离散系统采用三阶精度IMEX Runge-Kutta方法计算,对流项和粘性项分别进行显式和隐式处理.数值结果表明IMEX Runge-Kutta WCNS格式可达到三阶时间精度和五阶空间精度,比显式TVD Runge-Kutta WCNS格式计算效率高,且具有高分辨率的激波捕捉能力.
参考文献 | 相关文章 | 多维度评价
7. 基于Newton迭代法的最小二乘渐进迭代逼近
兰林, 朱春钢
数值计算与计算机应用    2022, 43 (1): 88-111.   DOI: 10.12288/szjs.s2021-0785
摘要444)      PDF(pc) (1654KB)(218)    收藏
最小二乘渐进迭代逼近(LSPIA)是一种有效的大规模数据拟合方法.针对LSPIA的加速问题,基于Newton迭代法,本文提出曲线曲面的两类最小二乘渐进迭代逼近格式.首先构造一个以控制顶点为变量的多元函数,其Hessian矩阵为正定矩阵,多元函数存在极小值,且其极小值所对应的控制顶点与LSPIA的收敛结果一致.对多元函数极小值问题,采用Newton迭代法进行求解.然后对Newton迭代格式中的Hessian矩阵和调整向量分别采用奇异值分解法和共轭梯度法求解,从而给出两种LSPIA迭代格式,分别记为NLSPIA和INLSPIA.最后给出两种迭代格式收敛性的理论证明.数值实例验证了文中方法的有效性和可行性,也表明了在相同条件下,NLSPIA与INLSPIA的收敛速度和计算时间都优于经典LSPIA.
参考文献 | 相关文章 | 多维度评价
8. 迭代逼近坐标
翟娜, 李亚娟, 邓重阳
数值计算与计算机应用    2022, 43 (1): 112-124.   DOI: 10.12288/szjs.s2021-0786
摘要338)      PDF(pc) (13870KB)(200)    收藏
广义重心坐标能把多边形内任意一点表示为其顶点的线性组合,因此广泛应用于计算机图形学等领域.本文用渐进逼近的思想计算广义重心坐标.给定多边形及其内一点,首先将多边形映射到以该点为圆心的单位圆上,依次连接映射到同一圆上的各边中点,形成新的圆内接多边形.然后构造以多边形相邻两个点为顶点,其余点的加权和为另一顶点的三角形,并在该三角形内创建初始迭代点.由三角形顶点及各边中点生成三条有理Bézier曲线.通过曲线调整迭代点的位置,达到逐步缩小其与待求点距离的目的.最后通过回代求出待求点的重心坐标.实例表明,迭代逼近坐标具有非负性和光滑性等良好的性质.
参考文献 | 相关文章 | 多维度评价
9. 求解稀疏连续线性系统的自适应SGCRO-DR 算法
徐达强, 荆燕飞, 胡少亮, 徐小文
数值计算与计算机应用    2022, 43 (2): 125-141.   DOI: 10.12288/szjs.s2021-0800
摘要765)      PDF(pc) (1295KB)(191)    收藏
GCRO-DR方法是求解一系列连续线性系统常用迭代方法.本文首先提出了~simpler GCRO-DR方法,在单个循环中它的计算成本比GCRO-DR更少.本文为了避免算法的不稳定性问题和内存溢出问题,并提高~simpler GGRO-DR算法的收敛性,引入了重启参数自适应策略.另外,在用该方法求解大型连续线性系统需要多次重启次数情形以及相邻系数矩阵之间谱信息相关情形,本文利用重启参数自适应策略提供的学习样本,通过强化学习来选取一个比较好的重启参数.最后,数值实验证明了所提三类算法的有效性.
参考文献 | 相关文章 | 多维度评价
10. 融合数值模式预报数据的深度学习PM2.5浓度预测模型
王舒扬, 姜金荣, 迟学斌, 唐晓
数值计算与计算机应用    2022, 43 (2): 142-153.   DOI: 10.12288/szjs.s2020-0711
摘要307)      PDF(pc) (1214KB)(146)    收藏
PM2.5污染问题是中国近年来引起广泛关注的环境问题,对PM2.5浓度进行预报有重要意义.传统的预报方法是基于空气动力学理论的数值模式预报方法.最近几年深度学习方法被广泛应用于PM2.5浓度预报问题.之前的深度学习预报方法主要是使用观测站的观测数据建立单点式的预报模型.本文使用ConvLSTM深度神经网络建立模型,在中国及周边区域的PM2.5数据集上实现了网格化的序列到序列预报.模型通过卷积模块提取空间特征,通过LSTM模块提取时间特征,适合解决PM2.5网格化预报问题.同时,模型中使用了再分析数据和模式数据两种不同来源的数据结合起来进行预报,融合了深度学习方法和传统数值模式方法.实验表明,模型的均方根误差比数值模式预报下降30.2%,具有良好的预报效果.
参考文献 | 相关文章 | 多维度评价
11. 弱链对角占优 B- 矩阵线性互补问题解的误差界估计
董瑛雪, 莫宏敏, 周翠玲
数值计算与计算机应用    2022, 43 (2): 154-162.   DOI: 10.12288/szjs.s2020-0712
摘要106)      PDF(pc) (330KB)(82)    收藏
通过利用弱链对角占优M-矩阵的逆矩阵的无穷大范数的范围,结合不等式的放缩技巧,给出弱链对角占优B-矩阵线性互补问题解的误差界新估计式.理论分析和数值算例均证明新的估计式改进了近期一些已有的结果.
参考文献 | 相关文章 | 多维度评价
12. 一种解抛物型方程的三层九点高精度加权差分格式
刘博, 陶善聪, 时晓天
数值计算与计算机应用    2022, 43 (2): 163-175.   DOI: 10.12288/szjs.s2020-0713
摘要157)      PDF(pc) (695KB)(89)    收藏
针对一维齐次常系数抛物型方程,采用显隐格式加权,构造出一种在时间和空间上分别达到四阶和八阶的高精度差分格式,通过理论推导,给出了满足稳定性条件的网比取值范围.通过数值实验及与文献方法的对比,验证了本文格式在满足稳定性的基础上可以达到预期的理论精度
参考文献 | 相关文章 | 多维度评价
13. 一类关于非奇异$H$-矩阵判定的细分迭代新准则
石慧, 庹清, 吴乐, 陈茜
数值计算与计算机应用    2022, 43 (2): 176-187.   DOI: 10.12288/szjs.s2020-0722
摘要388)      PDF(pc) (355KB)(74)    收藏
本文主要研究了基于$\alpha$-链对角占优矩阵关系的非奇异$H$-矩阵判定条件问题.利用非奇异$H$-矩阵的性质,以及$\alpha$-链对角占优矩阵与其的关系,通过对矩阵非占优行集合区间进行细分和构造新递进系数的方法,给出了一类关于非奇异$H$-矩阵判定的细分迭代新准则,改进了近期的一些结果,并用数值算例说明了该判定准则的有效性.
参考文献 | 相关文章 | 多维度评价
14. 粘性Burgers方程的高阶隐式WCNS格式
张旭, 蒋艳群, 陈勋, 胡迎港
数值计算与计算机应用    2022, 43 (2): 188-201.   DOI: 10.12288/szjs.s2020-0733
摘要257)      PDF(pc) (1021KB)(108)    收藏
JFNK (Jacobian-free Newton-Krylov)方法是由外层Newton迭代法和内层Krylov子空间迭代法构成的嵌套迭代方法.本文提出了一种基于JFNK方法的高阶隐式WCNS (weighted compact nonlinear scheme)格式,并用于求解一维、二维粘性Burgers方程.外层迭代法采用含参数的多步Newton迭代法,给出了收敛性分析,内层迭代法采用无矩阵GMRES迭代法.粘性Burgers方程的非线性对流项采用五阶WCNS格式计算.为提高方法精度和计算效率,时间离散采用三阶隐式的DIRK (diagonal implicit Runge-Kutta)方法.数值结果表明基于JFNK方法的隐式WCNS格式在时间上能达到三阶精度,与显式TVD Runge-Kutta WCNS方法相比,计算效率更高.此外,基于JFNK方法的隐式WCNS格式稳定性好,且具有良好的激波捕捉能力.
参考文献 | 相关文章 | 多维度评价
15. 基于异构计算平台的混合撕裂有限元求解优化技术
张鋆宸, 张纪林, 冯仰德, 王珏, 聂宁明, 丁佳明
数值计算与计算机应用    2022, 43 (2): 202-220.   DOI: 10.12288/szjs.s2020-0739
摘要242)      PDF(pc) (2056KB)(145)    收藏
混合撕裂有限元法(Hybrid Total Finite Element Tearing and Interconnecting method,HTFETI)适用于求解结构力学、热力学等问题,是一种非重叠的区域分解方法,适用于大规模求解.但是在异构计算平台上对反应堆堆芯组件进行数值模拟时,采用混合撕裂有限元法会出现进程内和进程间的负载不均衡现象.在混合撕裂有限元求解器中,最主要的计算是稠密矩阵向量乘.针对进程内和进程间出现的负载不均衡现象,本文实现了动态负载均衡技术,充分利用了节点内和节点间的处理器资源,加快求解速度.最后,本文通过数值实验验证了上述优化技术能够加快混合撕裂有限元法的求解速度8.2\%$\sim$9.4\%.
参考文献 | 相关文章 | 多维度评价
16. 求解双层集值混合变分不等式的惯性外梯度算法
蒋艺, 龙鑫, 王中宝
数值计算与计算机应用    2022, 43 (2): 221-236.   DOI: 10.12288/szjs.s2021-0754
摘要195)      PDF(pc) (485KB)(177)    收藏
本文在Tseng外梯度算法的基础上,引入了一种求解双层集值混合变分不等式的惯性外梯度算法.该算法的步长是非单调自适应的,结合惯性加速技巧,在集值映射是单调且Lipschitz连续的假设下,证明了该算法所产生的序列强收敛到双层集值混合变分不等式的解,进行的数值实验表明惯性外梯度算法优于一些已有的算法.
参考文献 | 相关文章 | 多维度评价
17. SPNP晶体管辐照损伤效应的有限元数值模拟
倪宇晖, 张倩茹, 王芹, 阳莺, 卢本卓
数值计算与计算机应用    2022, 43 (3): 237-247.   DOI: 10.12288/szjs.s2021-0807
摘要184)      PDF(pc) (727KB)(99)    收藏
结合辐照损伤模型和漂移扩散模型,研究辐照效应对衬底PNP (SPNP)双极型晶体管电学性质的影响.基于三维并行自适应有限元平台Parallel Hierarchical Grid (PHG),采用倒数平均有限元法对漂移扩散方程进行离散求解.同时,对间断的掺杂分布做了连续化处理,使其更接近于物理实际,也更有利于数值计算的健壮性.数值模拟再现了辐照后SPNP晶体管出现的基极电流增大及电流增益退化现象,并与横向PNP (LPNP)晶体管进行对照,最终得到这两类晶体管对辐照损伤的敏感程度上的差异.
参考文献 | 相关文章 | 多维度评价
18. 基于改进Levenberg-Marquardt算法的加速度计标定模型研究
李萌, 王淑娟
数值计算与计算机应用    2022, 43 (3): 248-258.   DOI: 10.12288/szjs.s2021-0740
摘要229)      PDF(pc) (832KB)(94)    收藏
对MEMS加速度计的标定模型进行研究是提高MEMS加速度计精度的重要方法.本文提出一种基于改进Levenberg-Marquardt算法的加速度计标定模型.基于静态多位置翻转法进行标定,根据误差建立数学模型即非线性最小二乘的求最小值问题,由于原始Levenberg-Marquardt算法在迭代求解最优估计值下降慢以及计算量大等问题,通过充分利用算法每次迭代的计算结果设置步长因子,获取最优估计值迭代次数减少,并在理论上证明了改进算法的收敛性.又针对标定后存在数值偏离真实值的问题,提出利用传感器状态信息对标定模型进行改进,使用改进标定模型的数值实验效果良好.
参考文献 | 相关文章 | 多维度评价
19. 带局部Kelvin-Voigt型阻尼一维波动问题能量模控制函数
高兴明, 卢朓, 姜海燕, 张琼
数值计算与计算机应用    2022, 43 (3): 259-269.   DOI: 10.12288/szjs.s2021-0743
摘要254)      PDF(pc) (3940KB)(93)    收藏
带有局部Kelvin-Voigt型阻尼波动方程能量衰减规律是控制论中一个热点研究课题,能量衰减规律的控制函数具有重要理论价值和实际意义.本文对带局部Kelvin-Voigt型阻尼的一维波动方程设计了经典三层七点隐式差分格式,数值验证了差分格式计算波函数、能量函数的二阶收敛性,研究了阻尼参数对能量模衰减规律的影响,并采用支持向量机方法拟合了能量衰减控制函数与阻尼参数的关系.
参考文献 | 相关文章 | 多维度评价
20. 空间分数阶对流扩散方程的格子Boltzmann方法
魏雪丹, 戴厚平, 李梦军, 郑洲顺
数值计算与计算机应用    2022, 43 (3): 270-280.   DOI: 10.12288/szjs.s2021-0745
摘要175)      PDF(pc) (510KB)(97)    收藏
本文建立了格子Boltzmann方法的D1Q3模型,数值求解了一维空间分数阶对流扩散方程.对分数阶积分部分离散化处理并进行相关收敛性分析.通过选择合适的演化方程,运用Taylor展开和Chapman-Enskog多尺度技术展开,正确恢复出宏观方程.数值实验验证了该模型的有效性.
参考文献 | 相关文章 | 多维度评价
21. 基于序贯性蒙特卡洛采样器的并行采样方法
吴江琦, 李敬来
数值计算与计算机应用    2022, 43 (3): 281-294.   DOI: 10.12288/szjs.s2021-0747
摘要176)      PDF(pc) (1003KB)(103)    收藏
许多科学和工程领域的问题经常会需要我们从一个给定分布中产生随机样本.在贝叶斯推断中,从后验分布中抽取样本是此类问题的一个代表性应用实例.常用的马尔可夫链蒙特卡洛方法比较难以发挥并行计算的优势,因此为了解决这个问题,在本文中我们提出了使用序贯性蒙特卡洛采样器作为在并行计算框架下对马尔可夫链蒙特卡洛方法的一个替代工具.具体而言,我们提出了序贯性蒙特卡洛采样器中两个不同的正向提议分布:高斯随机游动和朗之万正向核,并给出了相应的反向提议分布.结合数值试验,我们展示了在并行计算的条件下,序贯性蒙特卡洛采样器相比于多链条马尔可夫链蒙特卡洛方法,在计算效率上有明显的提升.
参考文献 | 相关文章 | 多维度评价
22. 求解一类复对称线性系统的广义AOR迭代法
李旭, 李瑞丰
数值计算与计算机应用    2022, 43 (3): 295-306.   DOI: 10.12288/szjs.s2021-0752
摘要163)      PDF(pc) (426KB)(116)    收藏
针对求解一类广义复对称线性系统,Salkuyeh等学者利用等价2×2块实值形式提出了一种广义SOR (GSOR)迭代法.为了进一步提高计算效率,本文建立一种含有两个参数的广义AOR (GAOR)迭代法.详细分析了该方法的收敛性,得到一个范围更广的收敛域.最后,通过两个数值算例验证了GAOR迭代法的可行性与高效性.
参考文献 | 相关文章 | 多维度评价
23. 广义Nekrasov矩阵的一组改进的判别条件
吕振华, 孙旭, 田万福, 温立书
数值计算与计算机应用    2022, 43 (3): 307-313.   DOI: 10.12288/szjs.s2021-0758
摘要123)      PDF(pc) (318KB)(81)    收藏
综合运用细节分析、指标集划分以及不等式的放缩技巧,给出了广义Nekrasov矩阵的新的判定方法,推广了郭爱丽、刘建州2009年和2016年提出的相关结论,并利用数值算例说明了判定条件的有效性.这样的改进思路同样适用于其他的广义Nekrasov矩阵的判定方法的改进.
参考文献 | 相关文章 | 多维度评价
24. 稀疏优化二阶算法研究进展
王锐, 修乃华
数值计算与计算机应用    2022, 43 (3): 314-328.   DOI: 10.12288/szjs.s2021-0759
摘要413)      PDF(pc) (567KB)(238)    收藏
稀疏优化是最优化学科近十余年发展起来的一个崭新分支.它主要研究带有稀疏结构特征的优化问题,在大数据分析与处理、机器学习与人工智能、信号与图像处理、生物信息学等学科领域有广泛应用.然而,稀疏优化属于非凸非连续优化,是一个NP-难问题.一直以来,人们通常采用一阶算法求解大规模稀疏优化问题,并取得了丰富成果.为提高计算速度和求解精度,人们近几年创新发展了若干计算花费少的二阶算法,本文主要介绍与评述其研究进展,奉献给读者.
参考文献 | 相关文章 | 多维度评价
25. 两阶段Arrhenius方程参数优化算法
金鑫, 汪韬
数值计算与计算机应用    2022, 43 (3): 329-342.   DOI: 10.12288/szjs.s2022-0827
摘要201)      PDF(pc) (526KB)(92)    收藏
锆合金腐蚀是燃料棒堆内重要的物理过程之一,它直接影响核电厂的经济性和安全性.根据锆合金腐蚀机理,在工程上通常采用两阶段Arrhenius方程来描述该物理过程,并通过试验数据来拟合方程中的参数.本文基于锆合金腐蚀试验数据和两阶段Arrhenius方程的特征,建立了基于Gauss-Newton法和线搜索法的参数优化算法,并使用非扰动和扰动的测试数据验证了算法的有效性.
参考文献 | 相关文章 | 多维度评价
26. 高性能计算中的性能工程问题
谭光明
数值计算与计算机应用    2022, 43 (4): 343-362.   DOI: 10.12288/szjs.s2022-0842
摘要350)      PDF(pc) (1344KB)(343)    收藏
高性能计算的核心目标是追求极致的计算性能.本文对高性能计算在硬件工程、软件工程、性能工程三个阶段需要攻克的核心技术难题进行了总结,并且重点针对E级计算发展趋势下实现复杂应用负载与多样异构系统之间高效适配存在的性能可移植挑战,阐述了性能工程的相关概念和研究意义,最后讨论了当前性能工程涉及的三大关键技术:模式驱动的性能建模方法、输入感知的智能调优引擎、统一抽象的软硬件代码生成.
参考文献 | 相关文章 | 多维度评价
27. 一类基于带约束能量最小基函数的数值均匀化方法的二维数值实现
刘新亮, 张镭, 朱圣鑫
数值计算与计算机应用    2022, 43 (4): 363-379.   DOI: 10.12288/szjs.s2021-0768
摘要150)      PDF(pc) (903KB)(70)    收藏
近年来,多尺度偏微分方程的数值均匀化方法得到了快速发展.本文以Rough Polyharmonic Splines (RPS)及其推广形式Generalized Rough Polyharmonic Splines (GRPS)为例,介绍了一类基于带约束能量最小基函数的数值均匀化方法的数学形式,并详细给出了基于粗细两网格,且具有拟最优计算量和收敛性的局部化基函数的数值实现方法.我们对具有多尺度系数的二维椭圆方程验证了这类方法的收敛性,此类方法在简单修改后还可用于多尺度Helmholtz方程等其他问题.
参考文献 | 相关文章 | 多维度评价
28. 基于GPU架构的两层并行块Jacobi SVD算法
黄荣锋, 赵永华, 于天禹, 刘世芳
数值计算与计算机应用    2022, 43 (4): 380-399.   DOI: 10.12288/szjs.s2021-0760
摘要184)      PDF(pc) (1170KB)(77)    收藏
SVD(singular value decomposition)广泛应用于图像处理、人脸识别、信号降噪等领域.本文基于单边Jacobi SVD算法给出了块间和块内两层并行的块Jacobi SVD GPU算法.为了更好地利用GPU的共享内存,块间并行通过存储矩阵列块之间的内积解决了共享内存不足的问题.此外,块间并行还通过矩阵块操作技术提高数据利用率及数据预取技术实现数据访问和数据计算的重叠.块内并行通过直接更新矩阵列块之间的内积替代了更新矩阵列块以及更新矩阵列块之后计算矩阵列块之间内积的归约操作,增加了GPU线程的利用率.另一方面,块内并行将需要多次访问的数据存储于共享内存或寄存器,减少了对全局内存的访问从而提升了算法实现性能.在NVIDIA Tesla V100 GPU上的数值实验结果表明,本文的算法较Cusolver库有1.8×倍的加速,较MAGMA库中最快的算法加速达2.5×倍.
参考文献 | 相关文章 | 多维度评价
29. 基于长短期记忆神经网络的非侵入式约化基方法在非线性波问题中的应用
郑淑雯, 高振, 袁春鑫
数值计算与计算机应用    2022, 43 (4): 400-414.   DOI: 10.12288/szjs.s2021-0762
摘要83)      PDF(pc) (2875KB)(49)    收藏
在基于反向传播(Back Propagation BP)网络的非侵入式约化基方法(BP-RBM)的基础上非侵入式约化基方法(Reduced basis method RBM)引入了长短期记忆神经网络(Long Short-Term Memory LSTM)提出了基于LSTM网络的非侵入式约化基方法(LSTM-RBM).该网络在继承循环神经网络(Recurrent Neural Network RNN)的可记忆性参数共享性图灵完备性等特性的基础上同时解决了RNN在长时间序列训练过程中存在的梯度消失和梯度爆炸问题.LSTM-RBM解决了BP-RBM无法准确求解的具有复杂非线性特性的非线性波问题例如二维Navier-Stokes方程和海洋内孤立波问题.此外在求解一般的非线性波问题中该方法相比BP-RBM在处理由非线性性质产生的大梯度结构上更有优势.数值测试结果表明相比于BP-RBM该方法恢复的降阶解与高保真快照解的误差可以缩小10倍左右.
参考文献 | 相关文章 | 多维度评价
30. 求解散射问题快速多极算法截断误差的一种新的估计
李瑞蓉, 孟文辉
数值计算与计算机应用    2022, 43 (4): 415-424.   DOI: 10.12288/szjs.s2021-0769
摘要225)      PDF(pc) (407KB)(56)    收藏
快速多极算法(FMM)是处理大规模多粒子系统的一种有效的快速算法.在应用快速多极算法求解散射问题时,相关的展开式和转换式都使用了Bessel函数的Graf加法定理.在实际计算中,算法的误差是通过截断Graf加法定理产生的.本文针对快速多极算法误差的特征,给出了Graf加法定理截断误差的一个新的估计,该结果比已有的结果形式更简单且逼近效果更好,这就使得本文的结果能够更好地应用于求解散射问题的快速多极算法中.数值实验验证了本文结果的有效性和精确性.
参考文献 | 相关文章 | 多维度评价
31. 非线性消去算法在跨音速全速势方程计算中的应用
周佳敏, 刘璐璐, 余瀚
数值计算与计算机应用    2022, 43 (4): 425-446.   DOI: 10.12288/szjs.s2021-0770
摘要84)      PDF(pc) (6930KB)(46)    收藏
基于非线性消去技术,构造了跨音速全速势方程的并行非线性求解器.首先详细阐述了跨音速全速势方程及其有限差分格式.其次,借助非线性消去技术,通过隐式消去局部强非线性的方式,改善牛顿迭代法的全局收敛性质,从而在激波存在的情况下达到加速收敛的目的.最后,研究了马赫数、网格大小、处理器个数以及局部子问题求解精度等参数对算法收敛情况和总计算时间的影响.数值结果表明,提出的右侧非线性预条件算法在求解全速势方程时具有很好的鲁棒性和可扩展性.
参考文献 | 相关文章 | 多维度评价
32. Krylov子空间法求解非对称代数Riccati方程
杨玉凤, 郭晓霞
数值计算与计算机应用    2022, 43 (4): 447-456.   DOI: 10.12288/szjs.s2021-0794
摘要145)      PDF(pc) (364KB)(78)    收藏
文献[1]给出了求解对称代数Riccati方程的Krylov子空间迭代法.本文利用该思想,提出了求解非对称代数Riccati方程的Krylov子空间迭代法.通过Cayley变换,我们得到了该方法的一个非常简洁的迭代公式,该公式只涉及矩阵计算.利用该公式,收敛性证明也变得非常简单易懂.最后数值算例验证了算法的可行性和有效性.
参考文献 | 相关文章 | 多维度评价