使用 NVIDIA BlueField-3 DPU 驱动下一波应用程序

chatgpt、stable diffusion、dall-e 以及类似的应用程序让生成式 ai 震惊了世界。chatgpt 是有史以来发展最快的应用程序。其易用性和令人印象深刻的功能在短短几个月内吸引了超过一亿用户。
生成式 ai 为企业重塑其产品和商业模式带来了紧迫感。正如 nvidia 创始人兼首席执行官黄仁勋在 gtc 2023 主题演讲中所说:“ai 的 iphone 时刻已经到来。” nvidia 加速计算正在助力全球企业通过解决超出普通计算机能力的问题来利用人工智能。
  nvidia bluefield dpu 助力加速计算
nvidia 加速计算技术堆栈使每个行业都能利用人工智能的强大功能,提供运行下一波应用程序所需的性能、规模和能效水平。
加速计算主要运行在三个基本元素之上:
cpu:用于串行处理和运行超线程应用程序。
gpu:擅长并行处理,并针对加速现代工作负载进行了优化。
dpu:非常适合基础设施计算任务;用于卸载、加速和隔离数据中心网络、存储、安全和管理工作负载。
在现代软件定义数据中心中,执行虚拟化、网络、存储和安全的操作系统可能会消耗近一半的数据中心 cpu 核心和相关电力。数据中心必须加速每个工作负载以节省电力,并释放 cpu 来处理创收工作负载。
nvidia bluefield dpu(数据处理器)卸载并加速数据中心操作系统和基础设施软件。
nvidia 正在其数据中心计算系统中集成 bluefield-3 dpu,包括第三代 nvidia ovx 系统,以便在数据中心规模创建和操作 nvidia omniverse 应用程序。想了解更多信息,请参阅 nvidia 发布用于驱动工业元宇宙应用的第三代 ovx 计算系统,推动 omniverse 实现大规模部署。
使用 dpu 的领先企业
oracle 云基础设施(oci)继在 gtc 2023 发布之后,最近公布了将 nvidia bluefield-3 dpu 集成到其网络堆栈中的计划。该计划旨在通过将网络和安全任务从 cpu 卸载到 dpu 来优化数据中心性能,从而实现更快、更高效的处理。
通过利用 bluefield-3 dpu 的强大功能,oci 随时可以增强其基础设施,为客户提供无缝的云体验。想了解更多详细信息,请参阅 oracle 云基础设施(oci)选择 nvidia bluefield 数据中心加速平台。
此外,包括 check point、cisco 、ddn、dell emc、juniper、palo alto networks、red hat 和 vmware 在内的二十多个生态系统合作伙伴使用 bluefield 数据中心加速技术来更高效地运行其软件平台。
nvidia bluefield -3 平台概述
nvidia bluefield-3 具有 220 亿个晶体管,是第三代 nvidia dpu。它是一款片上系统(soc)设备,可提供高达 400gbps 以太网和 infiniband 连接。bluefield -3 dpu 最多支持四个不同的 mac 地址,可以提供各种端口配置,从单个 400gbps 端口(四通道 pam4 112)到四个 25、50 或 100 gbps端口。
与上一代相比,bluefield-3 dpu 具有 2 倍的网络带宽、4 倍的计算能力和几乎 5 倍的内存带宽,同时通过 nvidia doca 软件框架提供完全的向后兼容性。
这些关键进步使 bluefield-3 dpu 能够以高达 8 倍的速度运行工作负载,同时降低 tco 并提高数据中心能效。例如,bluefield -3 dpu 可从 cpu 卸载 hpc / ai mpi 集合通信,将速度提高近 20%,这相当于为大型超级计算机节省 1800 万美元的成本。想了解更多信息,请参阅节能环保:nvidia bluefield dpu 提升数据中心效率。
图 1:与 nvidia bluefield -2 dpu 相比,
nvidia bluefield -3 dpu 的内存带宽和计算能力提高了四倍
bluefield-3 dpu 由三个主要模块组成:
网络:集成网络和安全硬件加速器的最新一代 nvidia connectx-7 智能网卡。
可编程计算:具有 16 个 arm a78 v8.2 核心组成的强大集群,专为控制平面应用程序提供优化的、完全一致的低延迟网络互连技术。数据平面可编程性通过加速管道线(pipeline)和新的可编程数据路径加速器(dpa)实现。数据路径加速器是一颗由 16 个超线程核心组成的 i/o 和数据包处理器,专为设备仿真、拥塞控制、自定义协议等 io 密集型、低计算任务而构建。
内存:双 64 位 ddr5-5600 内存接口(80gb 带宽)和集成的 32 通道第五代 pcie 交换机。pcie 接口可以分叉并用作服务器托管(端点)或自托管(根复合体),以管理 gpu 或直连 ssd 设备。
作为 “服务器前面的服务器”,bluefield-3 dpu 是唯一配备集成式 aspeed ast2600 基板管理控制器(bmc)的 dpu 平台。bluefield bmc 是一个专用处理器,用于监控 dpu 板的物理状态,并使系统管理员能够通过独立连接来管理平台。这增强了系统的安全性、可靠性、可用性和可维护性。
dpu bmc 是一个受信任的实体,具有自己的外部信任根,以确保其固件的安全。它支持通过独立的带外管理网络调配和管理 bluefield dpu,并使用标准接口和 redfish 协议管理 dpu 的整个生命周期。
bmc 的一些功能包括:
控制台接口访问 bluefield dpu
设置 bluefield uefi 配置
监测 bluefield dpu 及其资源
更新和恢复 bluefield dpu 固件
重置控制(即使在 bluefield 操作系统停止时)
bluefield-3 dpu 全面产品线
nvidia 提供了各种 bluefield-3 dpu 平台,旨在满足各行各业和用例的独特计算、内存和性能需求。这使客户能够选择符合其特定要求的 bluefield-3 dpu 产品,同时享受先进的功能和尖端的性能。
图 2:面向不同目标市场的
nvidia bluefield-3 dpu 旗舰平台
目标市场和旗舰平台
bluefield-3 dpu 用于几个关键旗舰平台和目标市场,具体如下:
超大规模高性能计算(hpc)/
人工智能(ai)
高性能计算和人工智能工作负载是率先采用 400gbps(ndr infiniband 和 400 gbe)网络速度的工作负载,因为高性能计算就是为了实现最高性能和巨大规模的。bluefield dpu 利用其 arm 核心从系统主机 cpu 卸载消息传递接口(mpi)的元素,并实现了无阻塞集合通信,从而扩展了 nvidia 网络计算能力。这使得系统主机 cpu 能够在峰值重叠时执行计算。
b3240:拥有满足极具挑战性的超大规模高性能计算/人工智能需求的强大性能和网络能力。此 bluefield-3 dpu 平台为 nvidia dgx h100 等系统提供动力,使其能够承担科学研究或生成人工智能的工作负载。它使用双 400gbps ndr 连接、32gb ddr5 内存子系统和 2.3ghz 的 arm 核心速度。
b3140h:具有半高半长(hhhl)外形规格,使其与大多数企业服务器兼容。该设备提供单个 400gbps 端口和 16gb ddr5 内存,同时在低功耗范围内运行。这使其成为高性能计算/人工智能环境的理想选择,在空间或电源可用性受限的环境下实现所需的可扩展性能。
云计算
云行业正在经历的快速增长要求云提供商不断创新和定制其服务产品,以满足客户需求。现代云平台使用基于虚拟机监控程序(hypervisor)的虚拟化,以最大限度地增加在计算和数据中心层面可分配给租户的虚拟实例数量。bluefield-3 dpu 支持多达 4096 个虚拟功能(vf),使云提供商能够在云计算平台上托管比上一代多 4-8 倍的虚拟实例。
b3220:提供双 200gbps 端口、32gb ddr5 内存子系统和 2.3ghz 的 arm 核心速度,具有满足最具挑战性的云所需的性能和网络功能。因此,超大规模 oracle 云基础设施(oci)已在其网络堆栈中添加了 bluefield-3 dpu,旨在提供最先进、可持续的云基础设施,并提供卓越的性能。b3220 平台还为 nvidia ovx 3.0 系统助力,实现更高的性能、零信任安全,并在云中无限扩展工业元宇宙应用程序。
b3210:100gbps 速率的 b3210 非常适合满足领先企业数据中心的需求。b3210 是运行企业工作负载平台 vmware vsphere 的目标 dpu,为成千上万的公司提高性能、效率和安全性。
储存
b3220sh:b3220sh 自托管平台对集成 nvme-of、nvme/tcp 或静态数据加速器的 nvme 存储系统进行了优化。b3220sh 可通过 32 通道的第五代 pcie 接口托管多达 16 个 ssd。
业界领先的网络性能
与上一代产品相比,bluefield-3 dpu 具有显著的性能提升,使其成为需要高性能网络的数据密集型人工智能工作负载的理想解决方案。图 3 显示了基准测试结果,证明了bluefield-3 dpu 领先的网络性能。
图 3 :nvidia bluefield-3 dpu
和 bluefield-2 dpu 的测试结果比较
使用 nvidia bluefield-3 dpu 
为您的应用程序助力
在云主导企业 it 的时代,生成式 ai、数据科学和元宇宙应用程序等现代工作负载正在蓬勃发展。为了满足对人工智能飞速发展的需求,云构建商开始采用 nvidia 加速计算(主要是 gpu 和 dpu)。
nvidia bluefield-3 dpu 由 nvidia doca 软件提供助力,将传统的计算环境转变为高效、高性能、安全且可持续的数据中心,从而实现下一波应用程序的交付。
观看下方视频
了解更多关于 nvidia bluefield dpu 的信息!
扫描下方二维码,或点击 “阅读原文” 查看更多有关 nvidia bluefield dpu 的信息。
扫描下方二维码,即可查看 bluefield-3 dpu 产品手册和网络产品资源。
nvidia bluefield dpu 往期内容   使用 vmware vsphere 8 和 nvidia bluefield dpu 加速 redis 性能
借助 nvidia dpu 和 nvidia doca 为人工智能时代的数据中心带来变革
gtc23 | oracle 云基础设施 (oci) 选择 nvidia bluefield 数据中心加速平台
nvidia 人工智能开讲 | bluefield dpu 如何帮助企业提升数据中心能效
白皮书发布 | 看 nvidia bluefield dpu 如何让数据中心变得更加环保
原文标题:使用 nvidia bluefield-3 dpu 驱动下一波应用程序
文章出处:【微信公众号:nvidia英伟达】欢迎添加关注!文章转载请注明出处。

小米跨界而来的智能家居梦
幅度调制什么意思_幅度调制基本原理是什么_幅度调制有哪几类
法拉电容和电池的区别 法拉电容能当电池用吗?
如何区分电容的正负极
国内连接器产业应坚持核心业务产业链“去美国化”
使用 NVIDIA BlueField-3 DPU 驱动下一波应用程序
华为P40系列手机曝光将会继续使用Android的EMUI操作系统
我国三大电信运营商预计将在2020年部署60万-80万个5G基站
灵敏电流计的使用方法
常见CPU故障处理方法
超高频射频识别系统读写器设计
浅谈数字电路板轨电压去耦在最坏情况下的电流脉冲
CES三星GearS3智能手表上手图赏,支持IOS设备连接
大功率DCDC调压器的电路原理图
该如何拯救我们的旧电脑 换个SSD固态硬盘就能满血复活
气体涡街流量计安装的环境要求与安装步骤说明
特斯拉新版弹射起步功能提升车辆性能
PCB阻焊层与助焊层的区别
恩智浦广播功率放大器实现DVB-T效率新突破
医疗设备健康档案系统设计及应用