美国阿尔特拉公司(altera)发布了预定于2015年底供应样品的高端fpga“stratix 10”的详情。stratix 10由2015年6月1日(美国时间)宣布收购阿尔特拉的美国英特尔公司代工,是利用14nm工艺制造的fpga。
stratix 10虽然以前就公布了概要,但披露器件产品线等详情还是首次。预定于2015年第四季度供应样品。
stratix 10通过改善fpga架构,将实现该公司以往产品“stratix v”约2倍的性能。不仅在逻辑元件(le)内,还在le外部的布线部分设置几百万个寄存器,将管道细分,视用户逻辑的类型,最大工作频率可达900mhz左右。
stratix 10与已经在供应样品的该公司的中档fpga“arria 10”一样,dsp硬宏支持浮点运算。最多的品种配备1.1万个以上的dsp硬宏,浮点运算性能超越美国英伟达的gpu、高达10tflops。该公司的产品营销高级总监patrick dorsey说:“我们的产品已经可以与英伟达的gpu展开全面竞争”,显露出对gpu的竞争意识。
与赛灵思在发展方向上的差异明确
stratix 10的特点主要有4个:(1)实现stratix v约2倍性能的“hyperflex架构”;(2)耗电量的削减;(3)采用英特尔的2.5d封装技术;(4)考虑到云端多租户使用的安全功能。
(1)的hyperflex架构,是类似于微处理器的超级管道技术。是细分管道,增加段数,使其能以更高的时钟频率工作的技术。
具体来说,stratix 10在接线段设置了专用的“hyper寄存器”。使用该hyper寄存器,将细分管道以提高频率。而一般的fpga,寄存器只配置在le内,接线段是不配置寄存器的。
图2:利用hyper寄存器细分管道
据称,因hyper寄存器的插入,是由编译器端自动进行的,逻辑电路设计者无需顾虑。阿尔特拉2015年5月发布的新设计工具“quartus ii”,配备了实现这一操作的功能。
按照该公司的估算,某无线通信基础设施用电路,stratix v的最大工作频率为491mhz,而stratix 10则为982mhz。在数据中心用的加速电路,stratix v的最大工作频率为156mhz,而stratix 10为452mhz。
图3:与stratix v相比的高速化程度
关于(2),与stratix v相比,stratix 10的耗电量最大可减少70%。除利用14nm工艺制造技术,降低了电源电压外,与stratix v相比,还能以较窄的位宽实现相同的性能,据称这也有助于降低耗电量。
图4:与stratix v相比减少的耗电量
图5:数据中心的使用示例
利用2.5d封装分离phy,为与xeon整合作准备?
(3)利用了代工商英特尔的2.5d封装技术“emib(embedded multi-die interconnect bridge)”(参阅本站报道)。
英特尔的竞争对手——美国赛灵思公司(xilinx)也在使用2.5d封装技术,但阿尔特拉和赛灵思的使用方式完全不同。
赛灵思是把fpga架构分成数枚芯片,用内插器连接。而阿尔特拉的战略,则是fpga架构封装在单一芯片中,收发器电路按照不同接口,准备不同的芯片。阿尔特拉把这种芯片叫作“区块”(tile)。
图6:区块的示意图
阿尔特拉将收发器电路作为单独芯片的理由主要有两个。一是为了方便支持今后可能面世的新一代高速接口。在支持对pci express gen 4等数据速率的高速化,以及含光通信在内等新调制方式时,分芯片更容易替换,实现起来方便。
另一个是fpga架构收纳在单一芯片中,le之间的通信“不像赛灵思那样,无需经由不同的内插器,可以提高可靠性”(dorsey)。赛灵思和阿尔特拉最近在片上存储器、浮点运算等许多方面,战略上的差异逐渐明确,2.5d封装的利用方法也明显不同。
阿尔特拉将收发器电路另分芯片,也可以看作是与英特尔的服务器微处理器“xeon”整合之前的准备。英特尔在宣布收购阿尔特拉之前,一直在计划推出将xeon与fpga集成于同一封装的产品。通过像英伟达gpu配备的接口“nvlink”那样,使在fpga端容易配备可以与cpu高速连接的接口,以提高其作为加速器的利用价值。关于这一点,阿尔特拉的dorsey表示“无可奉告”。
立足云端使用,fpga终将实现多租户化
关于(4),stratix 10加入了用来防范非法访问、防范篡改等的“安全设备管理器(sdm)”技术。在芯片内设置约15~150个扇区并予以隔离,使扇区可以单独配置和认证。
作为扇区的使用示例,阿尔特拉举出了防御设备中加密算法的隐藏、无线通信基础设施设备中特定电路的更新(在持续使用特定电路的同时,更新其他部分的电路)等。在该公司列举的示例中,最有特点的当属云服务的例子。
具体来说,就是云服务运营商在自己的基础设施中采用fpga,把单一fpga器件分割为多个扇区,出租给多位客户的使用形态。
这就像是在云计算领域,多家用户企业共用同一系统的“多租户”。可以说象征了“重视数据中心用途”这一阿尔特拉的现行发展方向。
图7:将单一fpga分割使用的“扇区”使用示例
最左侧的云端“多租户”使用象征着阿尔特拉如今的发展方向
美国微软计划于2015年下半年,将为本公司数据中心大量引进fpga,用来提高搜索引擎的速度,提供基于深度学习(cnn)的图像识别。
估计微软也在考虑把引进的大量fpga,经由该公司的云服务“azure”出租给客户。stratix 10规模最大的品种配备550万个le。达到如此规模后,在单一fpga中划分区域,提供给多个应用、多家企业共用的利用形式便成为了可能。
puf电路为intrinsic id制造
stratix 10为加强防篡改性、加密密钥等,在高端fpga中首次配备了puf(physical unclonable function)电路。puf电路是利用半导体制造误差造成的微小个体差异,生成芯片固有id的技术。采用的puf电路为荷兰intrinsic id公司制造。
配备puf的fpga此前美国美高森美公司(microsemi)曾推出过,“在赛灵思和阿尔特拉的高端fpga中配备,估计stratix 10还是第一个”(dorsey)。
arm内核也实现64位化
stratix 10与以往产品一样,也将准备配备arm内核的“stratix 10 soc”。阿尔特拉的fpga过去一直配备32位arm内核,stratix 10 soc将配备64位四核“cortex-a53”。最大工作频率为1.5ghz。
图8:stratix 10的品种一览
2015年我国将初步形成物联网产业体系
三星S21系列发布及开售时间曝光:价格够良心
二次仪表现场计量误差成因分析
当今世界新一代信息通信技术为代表的信息革命方兴未艾
未来智能工业机器人会代替人类的工作岗位吗
英特尔收购阿尔特拉 利用14nm工艺制造FPGA
SED1330控制器的性能特点与DSP接口电路软硬件设计
逆变电源的SPWM波形发作电路
华为荣耀V9评测:荣耀V9外观、配置很给力,华为荣耀V9能让华为P10懵圈!
为什么三绕组电压互感器的辅助二次绕组一般接成开口三角呢?
荣耀7评测 具备时代意义的旗舰新品
西雅特AtecaCupra:原装进口+四驱+百米加速6.5秒,全面配置信息及图片
智慧健身房“大脑”——智能魔镜显示屏
如何更高效地使用预训练语言模型
车规级贴片电容和普通电容之间的区别是什么
华为Mate 40来了,比iPhone12还贵
无毒的锌电池为新一代机器人设备供电的潜力
聚焦超级电容选型与应用
AI正从“感知智能”走向“认知智能”知识库
国内已设计出14nm香山芯片