GPU加速成为共识,CAE和仿真模拟的未来将走向何方?

cae(computer aided engineering,计算机辅助工程)始于50年代,由数学家、科学家和工程师共同开发,可用于求解分析复杂工程和产品。起先,cae旨在改善航空和汽车行业的设计,例如,模拟飞机周遭的冲击波、气流、温度数据,计算汽车模型表面的压力系数等。
随着半导体工艺对摩尔定律的进一步推动、内存的每一次进步以及cpu和gpu并行处理能力的倍增,cae性能随之扩展,其应用范围也逐渐延展至制造业的方方面面,并有势头成为 “数字孪生”、“工业互联网”、“智能制造”,乃至“工业元宇宙”的引擎。
1/cae转型:从cpu走向gpu,这头巨兽已迈出两个十年
作为一种资源密集型技术,即便历经大半个世纪的发展,cae领域仍然充满挑战,始终向新技术与新解决方案敞开大门。
·精益求精的工程师们提出需求:更真实!更复杂!更大规模!
altair、ansys、autodesk、dassault systèmes (simulia)、hexagon msc和siemens等主要工程仿真软件提供商长期依赖将cpu作为驱动计算的主要引擎时开发出的技术。最初,模型已经过简化,可适应计算系统,但制造业对仿真度有着孜孜不倦的追求。
然而,如若以基于cpu的工作流程来处理这些问题,则必须考虑到cpu的功能——必须缩小模型的大小、简化设计并管理网格大小,因此,最终评估的实体可能与要分析的真实事物大相径庭。显然,这又将我们带回了原点。1999年,nvidia发明了gpu (图形处理器),这为cae实现重大转型创造了舞台。就像许多受益于并行处理的领域一样,cae的主要任务是执行大规模并行进程。cae通过在模型上创建节点网格来评估模型,然后对节点应用力和条件,评估设计是否适合其用途。网格越密集,仿真就越可靠。对于gpu来说,这是一个显而易见的应用领域,软件供应商和硬件开发者在gpu出现的初期就已经认识到了这一点。
·半导体巨头推动gpu加速的普及
gpu的优势在于单个芯片上的处理单元数量远超cpu,从处理器的角度上来比较,gpu的成本远低于cpu,但gpu和cpu的工作方式各不相同,需要针对两者采用特定的编程方法,因而,为gpu调整这些程序却并非易事。 这时,gpu的发明者nvidia做出表率,于2006年发布nvidia cuda (compute unified device architecture)——一种并行计算平台和编程模型,并于2008年之后,与业内领先的公司合作推进opencl (open computing language,开放设计语言)——专为异构平台(cpu/gpu/dsp/fpga等)编程设计的框架。这些编程工具让开发者能够更轻松地利用gpu来大幅提升计算性能。
nvidia一直与cae开发者合作,创建为仿真分析可视化常见任务量身打造的工具。公司独树一帜,专注于gpu,推动其进入专用工具开发领域。2023年,随着nvidia的grace cpu的推出,其将在gpu+cpu的道路上发展得更加深远。
2/软件生态向gpu算力靠拢
半导体发展趋势、gpu在并行计算方面的独特优势,以及nvidia等gpu厂商为cae搭建的开发工具,让入局以gpu为基础的cae变得更加容易。
·cae不断迭代:提高自动化水平,注入ai
除了对更复杂、更逼真、更大规模的cae应用的需求外,21世纪初,计算机辅助设计 (cad) 软件供应商也开始获取cae技术以添加到设计工作流。集成到cad流程中的分析工具具有更高的自动化水平,这让设计师能够在工作时执行简单分析。
要实现上述两个愿景,需要构建插件和附加组件来实现gpu加速,并进一步添加云资源、推进高性能计算 (hpc) 的应用。同时,人们也越来越关注使用机器学习 (ml) 和人工智能 (ai) 来预处理和识别模型中值得关注的领域。
·软件厂商争先“吃螃蟹”
自2014年以来,各个主要cae供应商都在某种程度上利用了gpu加速。
ansys和hexagon专门针对gpu设计并编写了应用程序。
ansys针对gpu从头开始设计了应用discovery,这一互动实时仿真解决方案允许在流体、热力学、结构和模态应用中进行迭代设计探索。此后,ptc与ansys在2018年的liveworx 18数字化转型会议上宣布,ptc的creo 3d cad软件中将实现ansys discovery live实时模拟功能,这消除了cad与模拟活动之间的界限。
ansys discovery典型应用(图片来源:ansys)
同样,hexagon也决定从一开始就为gpu编写其新产品msc apex generative design,nvidia的cuda框架为hexagon的开发者提供了一个轻松的切入点,他们能够立即开始编码,不仅能够更快生成产品,而且将设计、网格化和分析功能融于一体。
msc apex generative design的工作流程
西门子则是致力于让其cfd软件可以在cpu与gpu之间无缝切换。2022年初,西门子发布了首个gpu版本的simcenter star-ccm+,这一版本在一开始专注于车辆外部空气动力学应用,随后,siemens工程师投入巨资,移植所有可在未来数年从gpu中受益的物理、求解器和相关软件部件。
达索系统(dassault systèmes)和altair选择将gpu加速逐渐应用于原有产品中。
达索发现,gpu的架构非常适合基于有限差时域仿真算法的cst studio suite电磁仿真和分析,且从工作站gpu到数据中心计算gpu的扩展效果非常出色。而altair在实践过程中得出,与用来处理类似工作负载的12个cpu相比,添加gpu可将altairedem的性能提升20倍。
cst studio suite允许客户访问多种电磁仿真解算器
altair edem的主要功能
迄今为止,已有来自10多个isv的120多个cae应用通过gpu进行加速。结果令人印象深刻,根据应用和工作负载不同,结果的交付速度最高可提升100倍。此外,随着gpu的添加,性能提升会进一步飞跃。随着越来越多的求解器移植到gpu上,可以预见性能会取得更大的突破。
·gpu自身的升级将为前期软件投资带来持续红利
以nvidia为例,在今年9月的gtc大会上,其推出了基于全新ada lovelace架构的nvidia rtx 6000工作站gpu,具有最先进的nvidia rtx技术,特点包括:
1)第三代rt core:吞吐量是上一代的2倍,能够同时运行具有着色或去噪功能的光线追踪技术。
2)第四代tensor core:相比上一代ai训练性能提升近2倍,扩展支持fp8数据格式。
3)cuda core:单精度浮点吞吐量最高达到上一代的2倍。
4)gpu显存:具有48gb gddr6显存,可处理大规模的3d模型、图像渲染、模拟和ai数据集。
5)虚拟化:将支持用于多个高性能虚拟工作站实例的nvidia虚拟gpu(vgpu)软件,使远程用户能够共享资源并驱动高端设计、ai和计算工作负载。
6)xr(扩展现实):视频编码性能相比上一代产品提升近3倍,可使用nvidia cloudxr流式传输实现多个xr会话同步。
nvidia rtx 6000 ada架构gpu提供了实时渲染、图形和ai功能,可以帮助设计师和工程师推动基于仿真的尖端工作流程,以构建和验证更复杂的设计。
凭借更大的二级缓存、更多的新一代核心和更高的内存带宽,ansys discovery和ansys fluent的用户可以通过释放nvidia rtx 6000的48gb gpu显存的全部威力,进行互动式仿真驱动的设计研究和高保真cfd仿真。nvidia针对这一应用发布了演示视频:
3/制造业利用gpu加速的cae向工业元宇宙延伸
在cae借助gpu过程中,没有一家软件公司采取相同的路线来实施gpu:他们都有自己的方法,对分析和仿真的作用有自己的理念,并有自身特别感兴趣的领域。但我们确实看到,随着gpu的出现,cae及制造业产品设计流程正在迅速变化。
同时,在元宇宙概念席卷各行各业的背景下,gpu加速cae的结果呈现方式将百花齐放。通过与xr相结合,设计师和审查人员可开启沉浸式工作;采用虚拟gpu技术,将让工作流程在不局限于本地算力的同时,保障数据安全性;将其置于协作平台(例如nvidia omniverse)中,则能打通制造业产品设计链路,大幅缩短正式投产前的准备时间。


智能毫米波雷达技术,人体存在传感器应用,智能感知控制方案
Linux与Unix的区别解析
用于血液检查元件的“金属网元件”天线技术
PLC控制系统设计的输入回路接线
全球最小的笔记本,体积只有7英寸轻达539g
GPU加速成为共识,CAE和仿真模拟的未来将走向何方?
曾经苹果在华市场可谓是风光无限这让库克无限疑惑:为何全世界只有中国不再爱苹果
荣耀10拆解评测:高颜值外表下的沉稳内心
目前众多的生物识别技术中,哪种才是最终的选择呢?
抢占智慧农业先机 村田助力智慧农业发展
基于CC-Link现场总线技术实现楼宇控制系统的节能设计
晶丰明源DCDC团队推出多套电源解决方案
量子力学三大定律公式
镍氢电池
讯飞AI录音笔SR702拥有多语言转写功能,转写准确率高
传感器制造工艺有哪些分类
规范中与访问重叠地址相关的一些细微差别讨论
RFID技术在高值医疗耗材物资管理方案介绍
什么是ZigBee的短距离无线通信网络技术
焊接贴片元件需要的常用工具