(本文是 Altair 与云合作伙伴 Microsoft Azure 合作编写)
碰撞模拟仿真技术可挽救生命,并有助于汽车制造商降低物理碰撞测试成本。
业内知名的Altair Radioss™求解器可对高度非线性、计算密集型问题进行结构分析,包括整车耐撞性、安全气囊性能,以及包含复杂变量的多物理场问题等。
汽车制造商通过使用 Radioss 求解器来微调其产品设计,依靠其高效的求解性能在更短的时间内衍生出更多的设计方案,并更快地将产品推向市场。
云端碰撞安全仿真
随着对高性能计算(HPC)的需求日益提升,云计算资源已成为公司内部计算资源普遍的替代方案。
近期,Altair 与 Microsoft 开展了深度合作。依托于Microsoft Azure 的云计算资源,Radioss 求解器表现出优异的计算性能。
在 Microsoft Azure,Radioss求解器最多可扩展到64个节点,而且并行计算性能不会受到影响 – 与使用本地计算资源测试得到的结果相当。
对于内部计算资源受限的客户,云计算是一种有吸引力的选择。 借助 Azure 云计算资源,对于求解器可扩展性和计算模型的规模,理论上没有任何限制。
对仿真计算时间有更高要求的用户可访问云计算资源中的更多计算节点,以更高效地得到计算结果。还可从本地计算中心爆发到云端上,以便实现更多模型同时计算,并更高效地完成计算任务。
Azure 技术
在云计算资源 Azure上,用户使用 Radioss 求解器可拥有 Intel 的最新版本处理器和 InfiniBand™ 高速网络的访问权限,从而满足海量计算任务和时效性高的项目需求。因此公司无需进行大量前期资本投入,即可进行虚拟仿真实验。
在 Azure HC 系列上,用户可以运行巨型计算作业,最多可一次调用13,200个核心。这些具有强大功能虚拟机(VM)的 Intel® Xeon® Platinum 处理器和 100 Gb InfiniBand 内部网络链接,可提供与一些最强大的超级计算机相媲美的裸机性能。
用于测试的云计算资源架构 Azure HC44rs,针对高性能计算进行了优化。每节点配有 Intel Xeon Platinum 8168 处理器,具有44个内核(主频2.7 GHz),每个内核分配8 GB(352 GB/节点)。同时,该系统配有高速本地存储(700 GB SSD)。
针对 Radioss 求解器优化
针对 Radioss 求解器对云计算平台进行优化,以发挥出最佳计算性能。
我们强调了本地SSD存储的重要性,以降低数据网络传输瓶颈;同时我们使用 Hybrid MPI 和 OpenMP 来保证良好的扩展能力。
纯MPI并行计算,最多可16个节点上体现良好计算性能。而当每个内核承担少于10,000个单元网格计算量时,混合并行计算方法(Hybrid MPI)在32节点和64节点表现出更优秀的计算效率。
Radioss 是一个具有自动MPI区块划分、OpenMP 并行和 AVX512 矢量化的高度混合并行求解器代码。其增强的性能可在大型HPC群集上实现高计算效率,同时允许MPI调整和OpenMP设置。
作为一款强大的求解器,Radioss可保证并行的高精确性、高可重复性、以及双精度(默认)或扩展单精度的计算结果一致性。
测试结果
我们采用的标准测试模型:福特金牛座(Ford Taurus) 100%正面碰撞模型,碰撞速度为50公里/小时。
模型包含一千万单元网格,最小单元尺寸为2.5毫米。完整碰撞模拟计算时间为120毫秒,这里采用计算2毫秒来进行可扩展性测试。
下图的“计算性能测试”图展示了从一个计算节点(44个内核)到64个计算节点(2,816个内核)的并行可扩展性测试结果。仿真模型计算完成时间,从单个计算节点的3,535秒降低到64个节点的163秒,计算效率提升近22倍。
计算性能测试
对于此仿真模型单元量级,纯MPI并行计算加速比可在最多16个节点上保持(704个内核)近乎线性加速。在32和64个节点上,纯MPI并行效率降低了。其本质原因是,每个内核要承担的单元网格计算数量少于10,000。
这种情况下,内核之间的数据交换成为了并行加速的瓶颈,从而降低了纯MPI并行加速的效率。如果使用纯MPI提交计算,保持良好的并行效率,使用16个节点为最佳选择。而基于MPI和OpenMP的混合并行求解(Hybrid MPP)有助于进一步缩短求解计算时间。
下面的“ 加速比”图,Azure与同类最佳超级计算机所得到的参考结果进行加速比对比。两者之间几乎没有区别!这意味着在Azure云上实现的加速比效果与最佳超级计算机的结果一样优秀。
加速比
微软很荣幸与Altair合作,并在 Microsoft Azure 上提供 Radioss 仿真服务。在 Azure HC 系列虚拟机上进行的测试表明,Azure 提供了优异的性能和扩展效率,与领先的本地HPC环境相比极具竞争力。这反映了 Azure 对向 Altair 产品的用户,以及整个 HPC 社区提供最佳 HPC 体验的持续承诺。
——Azure HPC 首席项目经理
Evan Burness
”
敏捷计算的未来
采用 Radioss 在 Azure 上高效运行以及可扩展的节点数量可与裸机群集相媲美的可扩展性,用户可以充分利用云技术尽快获得仿真结果,与使用本地计算资源一样快捷。
Azure保障了敏捷计算性能和灵活性,用户可以使用Altair PBS Works™软件(包括远程可视化工具)来降低部署的复杂性。
Radioss 求解器表现出了卓越可扩展性,可大大缩短计算时间。在Azure中运行大规模碰撞模拟分析模型,可加快产品设计优化和创新的步伐,它还允许企业将预算支出从资本支出(CapEx)转移到运营支出(OpEx)。
得益于云计算的性能和可扩展性,不仅构思到决策再到执行的过程更加迅速,甚至比许多本地计算资源所能达到的速度更快。微软最近发布了 Azure HBv2 系列虚拟机,该虚拟机最多可支持四个双精度和八个单精度 teraflops,我们期待在新一代的云技术上,看到更加出色的应用程序性能。
Radioss 是Altair HyperWorks™ 在Azure 无限虚拟设备中的求解程序堆栈的一部分。如需在设备上注册 Radioss 求解器的试用版,请点击下方按钮: