2018 全国高性能计算学术年会(hpc china 2018)于10月20日在青岛闭幕。大会以“hpc+一切皆可计算”为主题,围绕高性能计算技术的研究发展与发展趋势、高性能计算的重大应用等主题展开。
年会上,各领域专家学者围绕着高性能计算技术各抒己见,分享了高性能计算在其各自领域的最新研究进展。nvidia公司高性能计算及新兴业务中国区总经理刘通在大会主论坛发表了“nvidia gpu面向未来计算的持续创新”主题演讲, 为大家介绍了gpu在高性能计算领域的应用以及创新。
近年来,随着传统处理器在单线程运算方面遭遇到瓶颈,性能加速放缓。gpu为加速计算指明了新方向,gpu加速器每年正在以稳定的速率实现性能提升,其性能提升态势也将持续到未来:
如今 ,gpu框架凭借其强大的并行计算能力,已被众多超级计算机选做算力核心。目前,包括美国summit、sierra;日本abci;欧洲的piz daint在内的诸多全球顶级超级计算机都采用了nvidia gpu作为其算力核心。而且,目前已有70%的通用hpc程序已经实现gpu加速:
然而,与其强大算力相对应的是gpu服务器突出的性价比优势。相较于cpu服务器,gpu服务器成本需求更低,原本需要由160台skylake cpu服务器才能完成的计算量,只需8台v100 gpu 4 卡服务器即可完成,而总体成本仅是skylake cpu服务器的1/5;1台dgx-2的计算量相当于300台dual-cpu服务器,总体成本却只有其1/8:
此外,gpu能够实现hpc与ai的融合计算。hpc可为精准计算提供支持,ai则可以提高结果预测准确性加快反应速度。nvidia tensor core gpu能够满足hpc与ai的融合计算,利用多精度混合计算,实现hpc应用性能新突破。
应用广泛,gpu加速计算渗入各个领域
在实现加速计算的同时,gpu加速的超算平台还具有广阔的产业应用范围,能够在精准医药、气象模拟、新材料、无人驾驶、ai等众多领域发挥作用。中国石油东方地球物理公司研究数据处理中心赖能和总工程师在nvidia新技术与应用主题分论坛中介绍,中石油正在利用nvidia gpu加速计算处理石油海量数据。
在服务产业应用的同时,nvidia gpu加速计算也被广泛应用到科学研究中。南京大学周建教授介绍,南京大学高性能计算研究中心在使用nvidia gpu加速计算解决vasp杂化泛函数计算时感受了到gpu显著的加速计算效果。在进行crgete3的杂化泛函自洽计算测试时,相较于cpu,gpu的加速计算效果明显。据统计,对于此类较大的系统,1个v100 gpu可以比一个双路cpu服务器快10倍左右:
武汉大学蔡浩教授也在分论坛中进行了介绍,武汉大学过去在使用满带宽振幅分析软件(falls)进行分波分析时,存在要处理的事例数巨大;拟合模型非常复杂,参数空间巨大;拟合算法需要的计算步数非常多的困难。然而通过程序优化,拆掉大的数据结构,将计算部分的cuda代码,全部分解成小的片段,交由gpu计算,提高计算效率;将条件分支全部移到程序外部,交给cpu处理,从而实现了充分调动计算单元:
同时,进行算法优化,将所有的求和计算都在gpu中进行,gpu和cpu之间的数据交互降到最低:
目前,falls已经实现了多gpu联合计算,并且实现了线性加速。如今,falls可以处理更大的数据量和更大的参数空间,相较于算法优化之前,计算时常实现了1000倍加速:
中科院高能物理研究所石京燕工程师也表示,中科院高能研究所在进行高能物理实验时,同样会面临海量的数据和复杂的计算过程,许多应用程序都对采用gpu加速计算提出了强烈需求。如今,通过在juno实验中引入gpu加速计算;通过gpu加速计算进行交互式数据分析;基于深度学习进行事件重建,中科院高难研究所已经受益颇丰。
nvidia支持高校高性能计算教育
nvidia cuda应用市场总监侯宇涛在10月19日的演讲中表示nvidia在关注gpu技术创新的同时,也致力于支持高校中的gpu教育。2018年8月20-24日,nvidia支持举办了国内首次openacc gpu hackathon大赛,多支来自国内顶尖高校的队伍参赛。各团队基于nvidia v100 gpu对程序应用进行优化,实现了最大40倍速的计算速度提升。
此次hpc china,nvidia的专家们还把nvidia深度学习学院(dli)带到了年会现场,为学员现场揭秘深度学习技术及其应用,带领学员动手实验,展示如何通过在caffe框架上的nvidia digits和minist手写数据集,在深度学习工作流程中利用深度学习神经网络(dnn),尤其是卷积神经网络(cnn)解决图像分类问题。
nvidia gpu关注未来计算,持续创新
如今,具备更高计算能力的gpu技术为hpc应用的高速发展带来前所未有的强大计算引擎。随着hpc与ai的融合在更多领域的应用,计算单元需要同时具备超强的传统hpc计算力和深度学习计算力。最新的nvidia gpu系列,完美融合cuda核心与tensor核心,同时满足传统计算与ai计算的需求,并且配置一系列加速软件库,为应用开发提供最简洁优化的编程工具。nvidia gpu将不断向更高性能发起挑战,无论是硬件还是软件,都将保持着技术的高速创新。
工控电路板故障分析及维修方法汇总
全球电动车累计销量预计在九月突破400万大关,中国市场的地位举足轻重
国内半导体设备发展迅猛,出货额达到45.9亿美元跃居全球第一
一种新颖的开关电源设计方法
【芒果派MangoPi MQ Quad】bash命令行美化
GPU领跑运算性能,实现高性能计算新突破
霍尼韦尔将AV8OR 软件升级至2.0 功能进一步增强
NASA表示SpaceX载人龙飞船首次载人试飞仍将按计划发射
智慧路灯怎样融合物联网技术
压缩打包机PLC数据采集远程监控系统解决方案
应用元件技术升级 提升物联网应用等级
2.4G无线数传模块电路
分享一款基于C语言实现的FIFO模块:xqueue.
专为工业或车载应用的边缘计算而构建的可移动平台
旁路二极管在光伏组件中的作用
关于百度3麦克风阵列智能音箱功能介绍
华为荣耀Note8 VS 努比亚Max,结果意想不到!
Littelfuse 150520系列直列保险丝座的关键优势
迟滞比较器电路分析
万物互联时代下网络安全不可小觑