在过去的几年里,英特尔一直专注于其消费者酷睿台式机cpu,如果你认为英特尔已经忘记了他们的至强高端工作站处理器阵容,这是可以理解的。在英特尔台式机级至强w-1x00系列产品实际上已经退役,而intel当前一代用于服务器的大型芯片(基于sapphire rapids的第四代xeon scalable系列)也一再推迟,过去几年英特尔在工作站领域并没有太多的声音。但是现在针对服务器的sapphire rapids终于推出了,英特尔产品路线图中的僵局终于被打破了,英特尔终于可以继续将他们最新的芯片集成到新的工作站中。近期,英特尔宣布了他们的第一个从上到下更新的工作站处理器,至强w-3400和至强w-2400系列。针对英特尔大致划分为专家工作站和主流工作站的市场,这些芯片系列旨在用于高性能工作站的设置,特别是那些需要更多cpu内核、更多pcle通道、更多内存带宽或三者结合的设置。基于与英特尔最近推出的服务器相同的sapphire rapids芯片,新的至强w sku将降低许多(但不是所有)定义intel领先服务器芯片的功能,以及更适合在高性能工作站中使用的新芯片组(w790)和主板。与新的至强可扩展部件一样,这里的三大新增功能是转向英特尔的golden cove cpu架构——具有所有的ipc和时钟速度优势——以及对ddr5内存和用于i/o连接的pcle 5的支持。所有这些都是对构成英特尔之前产品堆栈的cascade lake和ice lake部件组合的重大升级。与此同时,与英特尔现有的台式机处理器阵容相比,这些都是2021年底在alder lake(第12代酷睿)上率先推出的功能,专注于工作站的xeon w部件将在更大程度上进行构建。
至强w-3400系列(sapphire rapids-112l)将从12核到56核不等,且都包括112个pcle 5.0通道,支持8个内存通道最多4 tb的ddr5-4800内存、ecc内存(仅rdimm)、intel vpro和intel标准可管理性(ism)。7个w-3400 sku(x系列)中的4个得益于解锁成熟,因此正式支持超频。与此同时,xeon w-2400系列(sapphire rapids-64l)将提供6到24个cpu内核,搭配减少的64通道pcle 5.0连接,支持多达2tb的ddr5-4800内存跨四个内存通道,以及所有其余的xeon w配件,如ecc内存。
新的至强w系列将取代英特尔之前的至强产品。虽然英特尔确实在2021年推出了一些基于ice lake的至强产品—至强w-3300系列—这些是对英特尔至强阵容的补充更新,针对需要额外cpu内核或pcie带宽的特定客户。对于其他人来说,即将推出的至强w系列产品,即大约2019年的w-3200和w-2200系列,都是基于英特尔的cascade lake芯片的,这本身是对英特尔skylake部件的适度更新。因此,推出至强w-3400/2400系列对英特尔工作站阵容的重要性不言而喻:这是英特尔至强系列的一次重大升级。
新的至强w系列将与amd的threadripper pro 5000 wx竞争,后者基于amd的zen 3架构。最近的threadripper pro于去年春天推出,从那时起,amd在cpu性能方面基本上占据了市场的主导地位,这要归功于内核数量和ipc方面的显著优势。即使有了他们的新部件,英特尔在技术上仍然没有完全缩小内核数量的差距,但ipc、内核数量和时钟速度的提升应该有助于在整体cpu性能方面达到公平的竞争环境,但具体程度还有待观察。
英特尔至强w-3400系列:“专家”平台,最多56核,112个pcie 5.0通道,8通道内存
英特尔至强的w-3400和w-2400系列工作站处理器基于英特尔的golden cove cpu架构,与英特尔的alder lake(第12代)台式机处理器相同。w-3400系列代表了英特尔第4代至强scalable sapphire rapids高级工作站产品的首要产品线,总共有7个sku。至强w-3400的范围从普通的12核/24线程部件(w5-3425)到备受期待的56核/112线程部件,旗舰w9-3495x。
特别是至强w-3400系列,基于英特尔sapphire rapids extreme core count (xcc)芯片,该芯片目前用于英特尔高端至强服务器部件。xcc芯片依赖于4个计算模块,使用英特尔最新的emib互连连接在一起,这是至强工作站处理器的第一个互连。
sapphire rapids xcc芯片的各个区块都是相同或对称的,因此每个磁片提供整个芯片四分之一的cpu内核、i/o和内存通道。因此,每个tile最多可以提供32个pcle 5.0通道(w9-3495x上总共有112个),而每个tile还包括两个内存控制器,在w-3400系列上提供8通道内存。
专注于至强w-3400系列的高端sku intel xeon w9-3495x,它与英特尔上一代巨无霸至强w-3175x有着类似的共鸣,后者于2019年发布,并提供了超频的官方支持。与基于skylake的至强w-3175x一样,最新的至强w9-3495x也有用于超频的解锁乘法器。
英特尔至强w9-3495x有56个核,112个线程,不像英特尔的台式机处理器,每一个都是性能(p)内核。此外,还提供了总计105 mb的英特尔智能l3缓存,官方支持8通道ddr5-4800 ecc rdimm内存,最大容量高达4 tb。
w9-3495x的tdp额定值相当高,为350瓦。在实际操作中,启用英特尔turbo boost和turbo boost max 3.0技术的情况下,满载时的峰值功耗可能会高得多,特别是在56-unlocked内核上。虽然它的56个golden cove内核的基本频率为1.9 ghz,但它的turbo频率高达4.6 ghz,而且由于turbo boost max 3.0(英特尔最青睐的核心技术),少数内核可以进一步提高到4.8 ghz。
至强w-3400系列的其他sku从36核到12核不等,如w9-3475x (36c/72t)和w5-3425 (12c/24t)。最终,所有至强w-3400系列都提供相同数量的ddr5内存通道和pcie通道,因此区分不同sku的是cpu核心数、最大内存时钟速度、l3缓存,当然还有价格。
与此同时,如前所述,四款至强w-3400 sku——w9-3495x、w9-3475x、w7-3465x和w5-3435x——都是“unlocked”处理器。这是英特尔几年来在至强w系列上没有提供的功能,并带来了一些有趣的现象。除了最基本的改变cpu时钟速度乘法器的能力外,“unlocked”处理器还可以调整其avx和amx偏移量,以防止处理器在沉重的simd负载下下降太多。最后,它们还为网状互连提供了一些调优选项,尽管英特尔没有说具体可以在这里进行调整。
英特尔至强w-3400系列的起售价为1189美元,intel提供每单位1k的定价(托盘),而不是单独购买的零售sku。至强w9-3495x的1kpu价格为5889美元,这使得顶级sku和后续的每个w-3400 sku比上一代的至强w-3300芯片更贵,但它们确实具有更多的内核,更快的频率,更多的l3缓存,并支持ddr5-4800。
值得指出的是,英特尔所有的w-3400 sku都支持高达4tb的八通道ddr54800 ecc内存,即使是最底层的sku,即w5-3425 (12c/24t)。因此,对于那些需要大量dram,但不一定需要大量cpu内核的系统,可以在至强的产品系列中找到合适的选择。但是,请注意,实际达到4tb需要每个通道使用2个dimm(dpc),这需要回退到ddr5-4400内存速度。
由于cpu提供112个pcle 5通道(芯片组提供更多通道),至强w-3400芯片可以支持大量的i/o设备。这相当于7个独立的x16显卡,或高达28个x4高速存储设备。这一点,以及内核数和内存通道,是与较低级别的至强w-2400系列的主要区别之一,对于那些被英特尔早期至强w部件的一小部分i/o带宽所困扰的英特尔平台用户来说,应该是一个受欢迎的特点。
有趣的是,112个pcle 5通道实际上比英特尔sapphire rapids服务器部件提供的要多。至强可扩展阵容最多只有80个通道。造成这种差异的原因是英特尔仅为其服务器部件启用了7个根端口中的5个,还有2个端口(32个通道)未使用。然而,由于工作站sapphire rapids部件不需要分配任何引脚来支持英特尔的多插槽upi链路,因此intel似乎已将这些引脚分配给为工作站部件提供额外的pcie通道。值得注意的是,英特尔在这里为服务器和工作站芯片使用了相同的插槽——lga 4677——但随着引脚的变化,它们可能不兼容。
同时,在英特尔的另一个首次发布活动中,该公司表示,他们将支持rdimm的ddr5 xmp 3.0内存超频配置文件。关于这个公告的细节非常少,但从高层次上讲,这将为运行在w790上的未锁定处理器用户提供尝试从内存中挤出更多空间的选项。一般来说,内存超频和rdimm坚如磐石的稳定性是截然相反的目标,因此,看看这在市场上的表现会很有趣。dram的时钟速度可能高于ddr5-4800,但注册的时钟驱动器(rcd)可以吗?
此外,所有这些关于rdimm的讨论都是有意的:与以前的xeon w平台相比,sapphire rapids xeon工作站平台将不支持udimm。这是ddr5规范的一个限制,它要求udimm和rdimm使用不同的电压。udimm为5伏,rdimm为12伏,因此不兼容。如果您曾经有机会亲眼看到ddr5 rdimm,您可能会注意到它们的键控与udimm不同,因此它们在物理和电气上都不兼容。
这意味着用户将不得不将这些处理器和w790主板与更昂贵、但质量更高的ecc支持ddr5 rdimm配对。对于羊毛染色工作站用户来说,这不太可能是一个问题,甚至不是一个能引起注意的差异,但任何希望以低廉的价格构建hedt风格的系统或低端工作站的人都会发现,xeon w系统的最终价格将高于w-3200/2200系列的价格。
加速计算:amx和cxl占据优势,但大多数领域特定加速器无法做到
对于sapphire rapids xeon芯片和相应的服务器部件,英特尔推出了一系列不同的加速块和其他加速器相关功能。在矩阵扩展(amx)、各种特定领域的硬件加速块以及对外部加速器的compute express link(cxl)的支持之间,英特尔最终将大量的精力投入到了非cpu任务中。这意味着,特别是针对其xeon scalable服务器部件,intel选择依靠这些加速器功能,在所有芯片中启用一个dsa引擎。仍然不支持qat、dlb和iaa。这取代了原始的x86 cpu性能,以使硬件与其前身及其竞争对手区别开来。
但对于他们的工作站部分,事情就简单多了,不管是好是坏。简而言之,并非所有英特尔的加速计算功能都在至强w-3400/2400系列中提供。那么,让我们来快速浏览一下哪些sapphire rapids功能适合xeon w。
也许最关键的是,英特尔的高级矩阵扩展(amx)确实做到了这一点,至强w-3400/2400系列完全支持它们。amx是英特尔的矩阵数学执行块,类似于张量核和其他类型的矩阵加速器,这些都是用于有效执行矩阵数学的超高密度块。amx不是一个专用的加速器,而是cpu核心的一部分,每个核心都有一个块,这允许amx代码与x86(和avx)代码混合,这也是sapphire rapids使用超密集代码时时钟速度偏移为负的原因。
amx是英特尔在深度学习市场上的重头戏,通过使用更密集的数据结构,超越了他们目前使用avx-512所能实现的吞吐量。虽然英特尔有amx支持的gpu(英特尔数据中心max gpu系列),甚至超越了这一点,但对于sapphire rapids,英特尔正在寻求解决需要ai推理的客户群体,这些推理发生在非常接近cpu内核的地方,而不是在一个不太灵活,更专用的加速器中。新的amx单元还支持bfloat16,确保英特尔的每一层加速计算块(avx和amx)都支持这种用于深度学习的常见中等精度浮点格式。
sapphire rapids的一个新的特定于领域的硬件加速器块,数据流加速器(dsa)也获得了成功。此块用于卸载/加速某些操作,如数据复制和简单计算,如计算crc32。dsa块可用于所有至强w sku。
然而,你不会发现提到其他的英特尔加速器模块,如英特尔动态负载均衡器(dlb),英特尔内存分析加速器(iaa)和英特尔快速辅助技术(qat)。尽管事实上,这些加速器都是蓝宝石激流硅片上相同功能块的一部分。这些加速器块主要都是针对服务器的,所以没有看到它们也就不足为奇了,但这确实意味着任何为服务器创建原型代码的人,如果要使用它们的功能,都需要在实际的至强可扩展服务器上进行测试。
最后,虽然intel的xeon w规格表中没有cxl支持,但intel已向我们证实,事实上这两个系列都支持cxl。用于主机到设备连接的基于pcie标准的内置技术已经出现了几年,sapphire rapids是第一个支持该技术的intel cpu平台。与其他一些功能一样,它主要用于服务器,因此将其引入工作站的动力较小。尽管如此,英特尔还是为希望利用其功能的用户提供了支持。
英特尔至强w-2400系列:最多24核,64个pcie 5.0通道,适用于主流工作站
再往下看,我们有xeon w-2400系列(sapphire rapids-64l),它被设计为“主流”工作站平台。xeon w-2400提供的pcie通道数量比w-3400 sku的一半多一点,有64个pcie 5.0通道可用,内存通道数量减少了一半,达到四个通道。因此,这意味着w-2400系列的价格低于其更强大的w-3400系列,入门级xeon w3-2423的价格低至359美元。
总体而言,至强w-2400系列将从6核到24核年不等。英特尔在这里使用了他们的sapphire rapids medium core count (mcc)芯片,与xcc芯片不同,它是传统的单片芯片。这意味着不需要花哨的emib封装来构建芯片,相反,英特尔只需要制造一个相当大的芯片。
至强w-2400系列的高端产品是w7-2495x,它具有24核/48线程,45 mb的intel smart l3缓存和225瓦的tdp。英特尔还有三个w5系列sku,最后是三个w3 sku。
与专家级同类产品一样,至强w-2400系列在整个系列中提供一致的内存和i/o配置。这是因为来自cpu的64通道pcie 5和四通道ddr5内存,允许总内存最大为2 tb。此外,只有w5和w7 sku提供完整的ddr-4800内存速度;w3部件都以ddr4-4400为上限。在2个dpc配置中,所有sku都下降到这个速度,因此出于任何原因构建2 tb系统都可以实现。
像至强w-3400系列一样,w-2400系列中也有一些unlocked x sku,包括顶级的w7-2495x。其他unlocked乘数的sku包括具有20个内核和37.5 mb l3缓存的w7-2475x,以及两个w5 sku(w5-2465x 16c/32t和w5-2455x 12c/24t)。然而,我们不会发现任何unlocked w3部件,因为所有三个入门级w3 sku都已完全锁定。
intel w790芯片组:支持xeon w-3400和w-2400平台
英特尔所有至强w-3400和w-2400系列sku均受益于英特尔vpro和英特尔的标准可管理性(ism)技术。xeon w-2400和w-3400系列都由相关的w790芯片组支持,但cpu特定的功能(如可用的内存通道和pcie通道的数量)取决于处理器本身。
w790芯片组的一些主要功能包括处理器和芯片组之间的直接媒体接口(dmi) 4.0 x8链路,以及多达16个pcie 4.0通道和支持多达8个sata 3.0端口。w790还支持5个usb 3.2 gen2x2 (20gbps)端口,包括一个intel wi-fi 6e phy,并可支持2.5 gbe控制器。
虽然没有提及新的主板,但预计将有来自华硕、gigabyte、超微和asrock等供应商的英特尔w790主板。戴尔、联想和超微等系统集成商预计将在diy构建商获得解决方案和系统之前优先提供解决方案和系统。
asrock在发布前大概介绍了其w790 ws模型,该模型具有20+2相供电,双10 gbe控制器,并支持8个插槽中多达2 tb的ddr5-4800 ecc rdimm。虽然该板同时支持至强w-3400和w-2400处理器,但该板仅支持四通道内存。
关于最新一代主板,值得一提的是w790主板的成本可能高于用于支持至强w-3300系列(ice lake)的基于c621的主板。因为w790单板有4个ddr5内存通道和48个pcie 5通道。虽然我们预计会看到不同级别的主板设计,具有不同的插槽和i/o配置,但英特尔还没有具体说明这些主板是否支持这两个系列,或者供应商是否会围绕xeon w-3400和w-2400系列设计特定的主板。
英特尔的至强w-3400和w-2400处理器已经开始接受行业合作伙伴的预定,系统预计将在3月初部署。英特尔对xeon w3-2423的预期和建议定价为359美元起,xeon w9-3495x的预期和建议价格为5889美元。
浅析现阶段工业机器人无法大面积普及的原因
联智通达科技LX-R12嵌入式主板介绍
英特尔发布oneAPI工具包正式版
《流浪地球2》的现实倒影(二):从IPv6到根服务器
阿里巴巴于今早的阿里云峰会上重磅发布PAI 3.0版本
英特尔的至强W-3400和W-2400处理器怎么样?
网络安全将面临越来越多的挑战
缺少应用支持,蓝牙5.0推出后遭质疑
伺服线束研发、生产和现场应用经验总结
浅谈DSTREAM仿真器转接板的接口
2023开放原子全球开源峰会|媒体专访OpenHarmony
Google大力推进平板电脑生态发展
PLC在工业控制中的应用
互补推挽式OTL功率放大器电路
华为收入达到1090亿美元超过阿里巴巴和腾讯
AI速配爱情不可行 人工智能没有配对爱情的权利
联想PC老大地位不稳 欲依靠AIoT新生态
电瓶修复技术之电池单个格的修复价值
作为新能源领域的另外一个重要板块,光伏行业会出现首富吗
环境保护水质多参数在线监测分析仪介绍