导语:cxl是一种开放式全新互联技术标准,可在主机处理器与加速器、内存缓冲区、智能i/o设备等设备之间提供高带宽、低延迟连接,从而满足高性能异构计算的要求,并且其维护cpu/gpu内存空间和连接设备内存之间的一致性,突破内存墙瓶颈,缩减整体响应时间。此外,cxl支持部署新的内存层,可以弥合主内存和ssd存储之间的延迟差距。
随着ai应用爆发,“内存墙”成为制约计算系统性能的主要因素之一。cxl建立在pcie的物理和电气接口之上,cxl内存扩展功能可在服务器中的直连dimm插槽之外实现额外的内存容量和带宽,支持内存池化和共享,满足高性能cpu/gpu的算力需求。
近日,佰维成功研发并发布了支持cxl 2.0规范的cxl dram内存扩展模块。佰维cxl 2.0 dram采用edsff(e3.s)外形规格,内存容量高达96gb,同时支持pcie 5.0×8接口,理论带宽高达32gb/s,可与支持cxl规范及e3.s接口的背板和服务器主板直连,扩展服务器内存容量和带宽。同时,佰维可针对无e3.s接口的服务器背板提供cxl aic转接卡。
佰维cxl 2.0 dram的特点和优势
搭载高性能内存扩展控制器,遵循cxl2.0 type3标准,支持pcie5.0x8接口,理论带宽高达32gb/s。 严选优质ddr5内存颗粒,容量高达96gb。 支持on-die ecc、side-band ecc、sddc、secded等功能。 允许多达16台主机同时访问内存的不同部分,支持内存池化共享。 同步开源发布cxl dram软件工具包,以确保用户无障碍部署cxl扩展内存。工具包特点:可提供cxl的显示,隐式api,客户可根据不同应用场景进行使用;可提供应用层级的cxl的numa工具使用方法,建立应用层级对cxl的直观感受。 latency性能方面,在实际测试中,佰维cxl 2.0 dram挂载于node 2节点,与挂载于node 0节点的cpu存取latency为247.1ns,带宽超过21gb/s,latency性能优异,赋能数据高速处理。
latency测试
bandwidth测试
人工智能(ai)和机器学习(ml)对高速数据处理的需求持续增长,佰维cxl 2.0 dram兼具支持内存容量和带宽扩展、内存池化共享、高带宽、低延迟、高可靠性等特点,赋能ai高性能计算。目前,佰维可为客户和合作伙伴提供32gb~96gb cxl 2.0 dram的功能样机,进行联合评估和测试。未来,佰维将持续关注cxl技术,赋能高性能计算需求。
延伸:aic转接卡
针对无e3.s接口的服务器背板,佰维可提供aic转接卡,助力服务器实现cxl rdimm内存扩展。
差分信号、时钟数据恢复、信道均衡基础知识
怎么判断数控机床机器人质量好坏?
白色家电用MCU更加智能
浅谈深度学习如何推动新兴技术的发展
微芯大梦:汽车芯片产业的创新故事
佰维发布CXL 2.0 DRAM,赋能高性能计算
防雷器的综合应用案例
微信小程序的APP页面配置学习说明
马斯克发布AI大模型Grok:挑战ChatGPT,X平台将搭载
无线传感器网络的特点与节点的应用设计
PLC无线传输模块支持哪些协议
基于CameraCube技术在图像传感器领域的应用研究
时隔3年半,Keil C51再次升级
灰色预测控制在有源滤波器中的设计应用
华大电子再次荣获“物联之星-2018中国最有影响力物联网安全企业奖”
先导智能与特斯拉签订巨额锂电设备合同
华为Mate X2是否值得高价入手?
福特投资 Solid Power 拟共同为下一代电动汽车开发固态电池
ISEN对太阳能研究的两大方向
处理器核心大战2010年即将打响