dpu(数据处理器)将服务器和存储之间的 iops 性能提升至 4100 万以上,超过之前世界纪录的四倍。
数据中心需要超高速存储访问,而目前还没有哪个 dpu 的速度能比 nvidia bluefield-2 更快。
nvidia 近期测试显示,两个 bluefield-2 dpu(数据处理器)的每秒输入/输出(iops)性能达到 4150 万次,超过任何其他 dpu 性能的 4 倍。
bluefield-2 dpu 使用标准网络协议和开源软件打破性能纪录,使用业界常用的存储介质访问方法 nvme over fabrics(nvme-of)以及最通用的互联网协议之一 tcp 网络,其 4kb iops 性能超过 500 多万,而 512b iops 则达到 700 万至 2000 万以上。
为了加速 ai、大数据和高性能计算应用,bluefield 还支持流行的 roce 网络传输选项以提供更高的存储性能。
在测试中,initiator 端和 target 端都部署了 bluefield,使用不同类型的存储软件库和不同的应用来模拟真实世界的存储配置,都展现出超强的性能。bluefield 在 infiniband 网络上还支持快速存储连接,而 infiniband 是许多 hpc 和 ai 应用的首选网络架构。
测试方法
bluefield 所达到的 4150 万 iops,是之前使用专有存储产品创造的 1000 万 iops 世界纪录的 4 倍多。这一性能是通过连接两台快速 hewlett packard enterprise proliant dl380 gen 10 plus 服务器实现的,其中的一台作为应用服务器(存储 initiator),另一台作为存储系统(存储 target)。
每台服务器均配备两个英特尔 “ice lake” 至强白金 2.3ghz 8380 处理器,支持 160 个超线程核以及 512gb 的 dram、120mb 的 l3 缓存(每个处理器60mb)和 pcie gen4 总线。
为了加速网络和 nvme-of,每台服务器均配备了两块 nvidia bluefield-2 p系列 dpu 卡,每块卡带有两个 100gb 以太网端口,在 initiator 和 target 之间有四个网络端口合计 400gb/s 线速带宽,并通过 nvidia linkx 100gbe direct-attach copper(dac)无源电缆背对背连接。两台服务器均安装 red hat enterprise linux(rhel)8.3 版本。
对于存储系统软件,测试 spdk 和标准 upstream linux 内核 target,使用默认内核 4.18 和最新内核之一 5.15。对三种不同的存储 initiator 进行了基准测试,分别为 spdk、标准内核存储 initiator 和 spdk fio 插件。使用 fio 和 spdk 生成负载并进行测量,使用 4kb 和 512b 这两种常见的中型和小型存储 i/o 大小来测试。
在网络传输层使用了 tcp 和 roce 两种协议来测试 nvme-of 存储,每种配置都在全双向网络的条件下以 100% 读取、100% 写入和 50/50 读取/写入负载模型进行测试。
测试显示 bluefield dpu 还具有以下性能特点:
用较小的 512b i/o 大小测试,结果显示 iops 更高,但吞吐量低于端口线速,而用 4kb i/o大小测试,结果显示吞吐量很高,而 iops 有所降低。
100% 读取和100% 写入两种负载的 iops 和吞吐量性能类似,而 50/50 读/写混合负载由于充分使用网络连接的两个方向产生了更高的性能。
使用 spdk 测试,得出的性能高于内核软件性能,但同时带来了更高的服务器 cpu 利用率,这是因为 spdk 在用户空间中运行并不断进行轮询,因此这一情况在预期之内。
由于 linux 社区会定期加入存储改进,因此较新的 linux 5.15 内核比 4.18 内核表现更好。
创纪录的 dpu 存储性能
为存储安全提供了性能保障
在如今的存储领域,绝大多数云和企业部署都需要快速、分布式、通过以太网或 infiniband 访问的网络闪存。更快的服务器、gpu、网络和存储介质都要求服务器的 cpu 能够跟上,而最好的方法就是部署具有存储功能的 dpu。
bluefield-2 dpu 所展现的惊人存储性能,使整个数据中心的应用服务器和存储设备都具有更高的性能和效率。
在快速存储访问的基础上,bluefield 还支持对以太网存储流量和存储介质本身的硬件加速加密和解密,这有助于防止数据被盗或外泄。
它能以高达 100gb/s 的速度卸载 ipsec(线上数据),以及高达 200gb/s 的速度卸载 256 位 aes-xts(静态数据),能够在对手入侵存储网络或者物理存储驱动器被盗、被出售或被不当处置的情况下,减少数据被盗的风险。
客户和领先的安全软件厂商正在使用最近更新的 bluefield 的 nvidia doca 框架,以在 dpu 上运行分布式防火墙,或提供微分段的安全组等网络安全应用,来进一步提高计算服务器的应用和网络安全,降低服务器存储的不当访问或数据修改风险。
原文标题:nvidia bluefield 再创 dpu 性能世界纪录
文章出处:【微信公众号:nvidia英伟达】欢迎添加关注!文章转载请注明出处。
日本BBT大学正在采用机器人来领取毕业证
洗牙器如何进行气密性防水检测
诺基亚8什么时候上市?最新消息:诺基亚8宣传海报曝光中国首发,是主打情怀还是王者归来?
受追捧的美容小家电产品质量参差不齐
低压配电系统中,浪涌保护器应设置在什么位置才满足规范的要求?
NVIDIA DPU 存储性能为存储安全提供性能保障
缓存使用中常见问题和解决方案
利用现成的硬件快速配置试验台,实现像无线连接的基本功能
无人机安全飞行10个小提示
成都铁路地区旧部改造中心商务楼及配套设施电气火灾监控系统的应用
工业控制网络应用系统集成的设计与开发
物联网助力智能驾驶的分析
AMD 7nm Vega架构将在今年完成流片
ZUKZ2现已可以升级到安卓8.0 时隔多年老用户哭了
国产最美轿跑荣威VISION-R,完胜大众CC,12万逆袭富帅!
Socket 754
OPPO Reno5 Pro+将搭载骁龙865,手机后盖可变色
盘点中国集成电路现状及未来发展趋势
土曼T-Ripple+智能手表评测 值不值得买
诺基亚6之后将推出复刻版3310 诺粉:看来不用期待诺基亚8了!