英伟达和亚马逊云科技宣布,将共同推出首款云ai超级计算机,将英伟达的h200 grace hopper超级芯片与亚马逊ultracluster扩展功能融合。
据悉,该合作项目代号为project ceiba,共计搭载了16384颗英伟达h200超级芯片,能够处理65 exaflops速度等级的ai运算,这个超级计算机是配备了h200 nvl32与amazon efa互连技术的大规模系统,将部署在亚马逊云科技之上。
这一合作项目的重要性得到了双方高层的亲自站台,亚马逊云科技ceo adam selipsky和英伟达ceo黄仁勋纷纷表示,他们共同的目标是发展生成式ai,为各个领域提供成本效益和先进的生成式ai。
亚马逊云科技首席执行官adam selipsky 表示:“今天,我们为图形、游戏、高性能计算、机器学习以及现在的生成式人工智能等工作负载提供最广泛的英伟达gpu 解决方案。我们继续与英伟达合作创新,将下一代英伟达grace hopper superchips 与亚马逊云科技的 efa 强大网络、ec2 ultraclusters 的超大规模集群以及 nitro 的高级虚拟化功能相结合,使亚马逊云科技成为运行 gpu 的最佳场所。”
ceiba项目是此次合作的基石,旨在创建世界上最快的 gpu 驱动的 ai 超级计算机,由 亚马逊云科技 托管,并专门为英伟达提供。这个雄心勃勃的项目将集成 16,384 个英伟达gh200 超级芯片(使用 gh200 nvl32 解决方案,包含 32 个 gh200 gpu 和 19.5 tb 统一内存),这些芯片将提供惊人的 65 个“ai exaflops”处理能力。这台超级计算机用于英伟达的生成式人工智能研发项目。
亚马逊云科技上托管的英伟达dgx 云是此次合作的另一个主要组成部分。该人工智能培训即服务平台是第一个将 gh200 nvl32 机器与 19.5 tb 统一内存结合在一起的商用实例。该平台为开发人员提供了单个实例中可用的最大共享内存,显着加速了高级生成人工智能和大型语言模型的训练过程,可能超过 1 万亿个参数。
此外,亚马逊云科技将率先提供 基于nvidia gh200 grace hopper superchips的基于云的ai超级计算机。这种独特的配置将使用 nvlink 连接每个实例 32 个 grace hopper superchip。它将扩展到数千个 gh200 superchips(和 4.5 tb hbm3e 内存),与 amazon 的 efa 网络连接,并得到高级虚拟化(亚马逊云科技 nitro system)和超大规模集群(amazon ec2 ultraclusters)的支持。
此次合作还将推出 新的英伟达支持的amazon ec2实例。这些实例将配备 h200 tensor core gpu,具有高达 141 gb 的 hbm3e 内存,适用于大规模生成式 ai 和高性能计算 (hpc) 工作负载。此外,g6 和 g6e 实例分别配备 nvidial4 和 l40s gpu,专为从 ai 微调到 3d 工作流程开发等广泛应用而设计,并利用英伟达omniverse 创建支持 ai 的 3d 应用程序。
此次合作将引入英伟达的先进软件 ,以加速亚马逊云科技上的生成式 ai 开发。其中包括用于创建聊天机器人和摘要工具的 nemo llm 框架和 nemo retriever 以及用于加速药物发现流程的 bionemo。
英伟达创始人兼首席执行官黄仁勋表示:“生成式 ai 正在改变云工作负载,并将加速计算作为多样化内容生成的基础。”在向每位客户提供经济高效的最先进的生成式人工智能这一共同使命的推动下,nvidia和亚马逊云科技正在整个计算堆栈上进行合作,涵盖人工智能基础设施、加速库、基础模型和生成式人工智能服务。 ”
此外,亚马逊云科技还宣布了自家芯片的大升级,发布了graviton4通用ai芯片。与上一代graviton3相比,graviton4的计算性能提高了30%,核心数量增加了50%,内存带宽增加了75%。这一芯片将应用于内存优化型的amazon ec2 r8g实例,提升高性能数据库、内存缓存和大数据分析工作的效率。
另外,trainum2芯片也亮相,主要用于拥有超大参数模型的训练。相比于上一代trainium1,trainum2在速度上提升了4倍,在能效方面也有2倍的提升。这一芯片将支持新的服务,为客户提供大规模的模型构建和训练能力。
亚马逊云科技不仅在硬件方面进行了升级,还发布了生成式ai应用搭建平台bedrock。亚马逊云科技的keynote演讲中,还展示了一款名为amazon q的工作版chatgpt,专为企业用户设计,帮助员工利用公司的数据和专业知识获取答案、解决问题。
明年三星Galaxy全系列将预装Samsung Pay
曝苹果今年将推出6款iPhone iPhone SE 2在列
精密恒温培养箱BPH-9042产品特点的介绍
项目分享|基于ElfBoard的远程监测系统
电力仪表:绝缘电阻、摇表、兆欧表显示不归零处理方法(最全)
英伟达与亚马逊联手打造了一台拥有16384个超级芯片的超级计算机
瞬态抑制二极管(TVS)的主要参数?|深圳比创达电子
简述VASS-标准去除钝化的过程
三星 Galaxy S21 系列包装盒曝光:未配备耳机和充电器
VOD
工业物联网的构建需要注意什么问题
赵杰:国内的机器人产业过于关注价格,真正的高端机器人产品很少
拥抱2020年,控制中国互联网70%流量:“四巨头”鏖战产业互联网
外网用户通过外网地址访问内网服务器实验配置
库克智能MKC电子哨兵解决方案 助力疫情防控
高频电子变压器及其发展方向
一种基于DSP的视频图像压缩系统的设计
【格视野】模型圈资讯第四弹:徕卡推自研首款激光雷达无人机、第一个专业无人机试验测试基地投用…
中国移动启动了基于SBA架构的5G SA核心网招标工作
降低EMI标准实现符合CISPR 22标准的电源解决方案