英伟达的新杀器又来了。
刚刚,在gtc 2018大会上,黄仁勋发布全球最大gpu。
他说的是dgx-2。
dgx-2能够实现每秒2千万亿次浮点运算(2 pflops),性能比去年9月推出的dgx-1性能提高了10倍,售价39.9万美元(人民币250万元)。
这次的gtc 2018大会在美国加州圣何塞举行,黄仁勋照例身着皮衣登台演讲。(官方还特别提示:这次是一件全新的皮衣)
而老黄这次的演讲主题,是四个amazing:amazing graphics、amazing science、amazing ai、amazing robots。
首先,从不可思议的图像开始。
在这个环节里,黄仁勋介绍了英伟达在图像实时光线追踪处理方面的最新进展,展示了细腻的反射效果。
这项技术,称为rtx。它面向图形领域,借助深度学习技术,实现了实时光线追踪。
然后黄仁勋发布了首款基于volta架构的工作站gpu:quadro gv100。
它支持英伟达rtx技术,支持nvlink 2,32gb容量hbm2显存。两个gv100相连,可以提供10000多个cuda核心,236 teraflops的tensorflow核心。
说着说着,老黄又开始讲这句:买得越多,省得越多。(the more gpus to buy, the more money you save.)
“来gtc,学习如何节省百万美元。”老黄发出诚恳的建议。
然后进入不可思议的科学环节。
我们正处在gpu计算的关键点,黄仁勋表示。这部分他还介绍tesla v100等产品的多快好省,也谈到一些gpu在计算和医疗影像方面的贡献。
比如医疗影像超级计算机clara。
深度学习给医疗影响的识别带来了诸多变革,但投入到实际使用中却很难。医院用着十几年前生产的超声仪,黑白渣画质成了医疗进步的阻碍。
要等所有医院升级设备,可能要花上30年。
clara是一款医疗影像的超级计算机,让医院可以升级那些已有的系统。医生可以仍然用原有的超声、ct等设备,然后将图像输入超级计算机,推理出更清晰的图像。
在这个项目上,英伟达联合了一大群医疗行业的合作伙伴:
以及在这个环节,黄仁勋又引导全场跟他念:买得越多,省得越多。
来到不可思议的ai环节。
这个环节的主题是“全球最大的gpu”。
首先,英伟达把volta v100m每张卡的内存扩大到32gb。适用于内存密集型的深度学习和高性能计算,还能将内存受限的hpc应用性能提升高达50%。
其次,是全新发布的互联结构nvswitch,带宽比最好的pcie交换机高出5倍,最高支持16个tesla v100同时以2.4tb/秒的速度进行通信。
最后,一个全新的dgx服务器发布了。
黄仁勋说这个现在是全球最大的gpu了:新的dgx-2,包括20亿个晶体管,12个交换机。每个gpu都可以通过光纤交换机互相通信,比pcie接口快20倍。
dgx-2的算力可达2千万亿次浮点运算,功耗10千瓦。这台机器内部是nvlink连接的两组tesla v100阵列。
与6个月前发布的dgx-1相比,dgx-2提速10倍。
五年前,在两块gtx 580上进行alexnet训练耗时六天,现在使用dgx-2,可以在18分钟以内完成。
这款产品将于今年三季度发售,每台价格39.9万美元(人民币250万元)。
dgx-2具有300台服务器的深度学习处理能力,占用15个数据中心机架空间,而体积则缩小60倍,能效提升18倍。
此外,英伟达还更新了cuda、tensorrt、nccl、cudnn等深度学习和hpc软件堆栈。
新版的tensorrt能快速优化、验证和部署在超大规模的数据中心,针对更广泛的应用加速深度学习推理。它最高可以 将深度学习推理的速度加快190倍,降低70%的数据中心成本。
tensorrt 4还集成到了谷歌tensorflow 1.7版本中,更易于使用。
另外,nvidia还宣布和arm合作,将英伟达深度学习加速器架构集成到arm的project trillium上,在手机、智能家居等设备上实现深度学习推理。
以及英伟达gpu现在支持kubernetes了。这是一个基于容器技术的分布式架构方案。这个技术让英伟达的gpu进一步加速。
还有一事,英伟达骄傲的宣布,titan v仍然断货中。
最后是不可思议的机器人环节。
发布了机器人开发工具包issac sdk之后,话题转向了自动驾驶。
“我们正试图从头到尾了解这个系统,这其中包含四个最重要的方面:数据收集、模型训练、模拟和驾驶。”老黄说,这个了解过程,大约花了5到7年。
老黄在现场,又展示了一把云代驾。
他把vr和自动驾驶结合起来。通过一个vr眼镜和方向盘,就能启动自动驾驶汽车。
云代驾所用的平台,是新鲜发布的nvidia drivetm constellation,基于两台服务器。
第一台服务器运行nvidia drive sim 软件,用以模拟自动驾驶汽车的传感器,如摄像头、激光雷达和雷达。第二台服务器搭载nvidia drive pegasustm ai汽车计算平台,可运行完整的自动驾驶汽车软件堆栈,并能够处理模拟数据,这些模拟数据如同来自路面行驶汽车上的传感器。
老黄又详细介绍了英伟达的感知基础架构。
每辆汽车都在收集pb级的数据,每个月有1500人大概标注100万件物品。
老黄表示,英伟达并没有试图建立一个基于软件定义的计算机的自主车辆系统,确切的说是在研究一个架构。
英伟达以drive px parker单芯片架构为基础创建drive xavier。这是一个四芯片系统,包含两个xaviers和两个voltas。
这台耗能300瓦的电脑正在用于机器人汽车,将于今年晚些时候投入生产。
对了,这项技术英伟达拥有全部产权。
btw,英伟达今天还宣布暂停了自动驾驶测试。
可能是受此影响,发布会一开始,英伟达股价就同步下跌,至发布会结束,英伟达股价累积下跌6.64%。
熊猫2158型彩电模拟量共用电路
信号频谱分析和测试
中国电信提出的5G SA组网已正式立项
基于区块链技术的社区解决方案Slash Planet介绍
难以翻越的“洛基山脉”,5G大时代下的挑战
英伟达的新杀器:全球最大GPU性能提升10倍,售价39.9万美元
真假5G难辨 AT&T宣布5G正式商用
这样的求婚你能接受吗?国外小伙在VR游戏中求婚成功
全球智能手机Q3季度出货量排名公布,OPPO海外出货量接近五成
预测:今年TWS市场规模将达到1.20亿部,中国市场环比增长44%
单端正向开关电源电路分享
扬尘检测仪在建筑工程中的作用有哪些?
停车场无人管理可能实现吗
在进行微能量采集的管理应用与系统设计时需要注意这些
果粉再不用“卖肾”买苹果了,但iPhone7租金一年3960元遭网友吐槽
光伏大事报:通威50亿项目签约,彭山电池设备进场;天合光能53亿项目;新选手豪掷60亿投……
日本“妻子”机器人被哄抢,不要房车不要彩礼
液晶电视的使用寿命大概有多长需要注意什么
ODCC推出25G ToR交换机,加速了25G网络的到来
英伟达和博世欲加盟DeepMap,助力其全球范围内的规模化部署