从苹果M1 Ultra看先进封装技术

苹果在本月初发布了最新一代的m1 ultra芯片，采用了独特的 ultrafusion 芯片架构。借助桥接工艺，这款ultra芯片拥有 1,140 亿个晶体管，数量达到了m1的 7 倍之多。虽然芯片还是采用与上一代m1 max一样的5nm工艺节点，但在新架构加持下，两颗 max 之间的互连频宽可达 2.5tb/s。这种架构的好处是运行在目前m1芯片上的软件无需修改相关的指令就可以直接运行，省去了应用端更新软件或开发新应用层命令的需求。同时，增加一个芯片后，对内存处理的带宽也直接翻倍，收获的性能提升非常显著，特别是针对gpu处理能力方面，是极具爆发力的。
苹果m1芯片进化（source：apple）近日，评测机构也对比了几款主流芯片与m1 ultra的性能。在单核处理能力上，ultra并不比max优秀。但在多核多线程的性能上，性能翻倍，可以说是秒杀上一代芯片。但相关的功耗并无披露，在之后的评测中可以继续关心相关性能。
m1 ultra多核多线程处理能力对比（source：wccftech）从目前透露的信息，并不能确定m1 ultra来源于哪种桥接工艺（估计随后的teardown即可见分晓），因为目前包括tsmc和intel都有埋入硅桥的类似量产工艺。但由于使用的是2个同样的芯片，从芯片设计角度来说并不能算严格意义的chiplet，更多是一个multi-die package的设计。作者观点，考虑到台积电为apple主力代工的关系，采用台积电埋入硅桥的可能性较大。从台积电宣传介绍了解到lsi在去年q1还在做验证，而m1 max在去年10月左右推出，m1 ultra今年3月推出，在开发时间上虽然很紧凑但也并非不可匹配。m1 max在推出的时候也预留了桥接的i/o，加快了m1 ultra的开发周期。由此可见ultra早已在1年前或更早时间就已经在苹果的计划中。
台积电的局部硅桥（local silicon interconnect）（source: 台积电）台积电的硅桥技术分为硅通孔桥和硅上rdl桥。所谓硅通孔桥就是在埋入的硅桥中有tsv，信号穿过硅通孔，通过tsv进行桥接。而rdl桥就是在硅上进行rdl制备，而为了确保可靠性和工艺兼容，目前主要的绝缘层材料大多采用abf或低热膨胀emc。
台积电局部硅桥（local silicon interconnect）（source: tsmc）台积电局部硅桥基于晶圆级硅工艺，比如金属化和钝化层形成等仍然是采用ic制造机台，因此其rdl精度非常高，可以轻松实现2微米线宽。这与intel的embedded multi-tile interconnect bridge（emib）工艺完全不同，因为emib是使用板级基板工艺机台，虽说硅桥本身可以做到2微米线宽，但埋入的后期工艺配合上有些挑战，本文后面会介绍。
台积电高密度rdl （source: tsmc）台积电的info/cow我们接收的信息比较多了，很多文章有介绍过，这里不进行详述。接下来我们重点看看intel的emib技术。早在2011年的一个封装国际会议上【1】, intel的工程师就提出了用硅桥连接2个硅处理器的概念。而当时的版本还未提及埋入这一概念，只是展示了桥接后较好的电性能。对如何封装，如何大规模生产，以及如何保证封装体的可靠性等都是未知数。
硅桥连接【1】但很快，intel在次年（2012）的一份专利中将目前版本的雏形进行了描述【2】。而这份专利直到2015年授权之后才被公开。所以，我们其实能看到的最早对emib的详细描述是intel在2016年ectc发表的论文【3】。在这篇论文中，intel展示了emib的结构，工艺，样品性能等。通过这一技术，emib可以实现与cowos类似的i/o数量和带宽。然而，开发结合封装基板技术与芯片制备技术的混合芯片封装体充满挑战，即使强大如intel也花费了不少时间，至今才达到了能量产的程度。接下来我们结合intel发表的一些公开的论文，试图管中窥豹。
emib内部结构示意图【3】相对于其他2.5d/3d封装技术，emib的主要技术优势有以下几点【4】：
1 利用先进有机基板工艺实现局部高密度布线。区别于需要更大尺寸硅中介层和高密度硅通孔（tsv）的其他2.5d多芯片封装技术，能针对i/o需求实现局部高密度布线。
2 无光罩尺寸限制。由于要保证曝光显影的精准度和数值孔径，光刻工艺的光罩尺寸范围通常有其限制，例如m1 max的芯片最大可用尺寸在19.05mmx22.06mm（约420mm²），已经是台积电硅桥cowos工艺的一半。emib则无需限制芯片尺寸，可以通过局部硅桥实现相对自由的芯片尺寸搭配（info-lsi也是干这个事）
3 相对硅tsv而言，emib的制造工艺更简单，成本也相对更低（如果良率相等的情况）。同时，减少更多硅的浪费，只在需要互联的地方放置硅桥。
然而主要的挑战在板级工艺。因此emib缺点主要集中在工艺实现【4】：
1 引入了更复杂的有机基板制备工艺，在精准度控制上远高于目前的有机基板布线。由此需要针对这一系统进行特殊材料和工艺的开发。
2 跟普通的倒装芯片类似，由于有机基板的热膨胀系数（cte）与硅桥芯片的cte存在失配，使得表面贴装的芯片引脚，芯片背面和填充热界面材料之间产生较大的应力。
emib工艺由于搭配了硅和有机基板工艺，所以在技术上体现了目前先进封装的一个主流趋势 - 融合，特别是前段硅制程与后端封装制程的融合。从硅桥部分来看，通常，硅桥的尺寸在2-8毫米左右，而芯片厚度在75微米以下，从而保证跟基板工艺所匹配，同时实现较高精准度的布线和对准工艺。目前intel针对的是4层布线结构的开发，能满足大多数i/o需要。虽然，目前硅桥上的金属布线的线间距可以稳定实现2微米，进一步进行细微化也是非常可行的，因为金属布线的结构都是在目前成熟的硅后端工艺中进行制造。然而，随着布线宽度的减小，线电阻会急剧增加，线间的电容也会改变，这给信号的完整性（integrity）增加了挑战。因此，在进行硅桥走线设计时，需要非常详细的架构设计和模拟工作来保证最终的产品性能。另外，介电层的材料介电常数和高频损耗对布线也有影响。因此，硅桥的设计工作是非常挑战的，它完全不同于目前的硅芯片设计师们的日常设计理念，而需要懂材料，懂封装，懂制程和懂信号完整性的资深工程师（们）来共同实现。
硅桥内部结构示意图【4,5】从硅桥的集成部分来看大概的工艺流程涉及到几个关键步骤：基板的压合，铜制程，激光以及芯片贴装的埋入工艺。针对特殊工艺，intel开发了自家的埋入封装（embedded）制程。其实在当时埋入封装已经不是什么新东西，日本的厂家在早年曾做过针对电阻电容的埋入封装。但由于那时还是pcb工艺，用的是co2激光，非常粗糙；镀铜工艺也相对落后，根本没法做2微米的线宽，自然也不会有人想到用基板工艺去做芯片的高密度连接。intel在10年前能想到用硅桥技术结合埋入封装确实是一个大胆之举。在加成法（additive）镀铜工艺和coreless基板工艺成熟后，emib的实现也就水到渠成了。
emib工艺示意图【4】埋入的过程由于采用有机基板工艺，对公差的控制提出了更高的要求，例如芯片的厚度，芯片的切割，芯片的贴装，和薄片的转移等都是及其挑战的，需要独有机器进行配合。另外，整体的基板制备是扇出型的大板（foplp）封装形式（500mm x 500mm），对板级的工艺一致性要求非常高。然而，在达到相对成熟的工艺良率后，产出的成本是相对较低的。同时，大板封装有其先天优势，适合制造非常大的集成芯片，这与目前的小芯片（chiplet）技术上的需求是吻合的。与普通foplp不同的是，emib并不需要将芯片从临时的载板上取下，当芯片被贴上之后就是永久固定的，减小了芯片在后续工序中位移的风险。
埋入在有机基板中的硅桥【6】硅桥的芯片虽然只有2-8mm，但是小于75微米的薄片会由于内部的cu布线结构产生芯片翘曲。另外，芯片贴装膜（daf）的存在也会直接导致切割后的芯片产生翘曲。因此，如何控制贴装之后的芯片不产生孔洞及分层，乃至芯片破裂又是一个挑战所在。针对这一要求，intel开发了针对这一工序的daf材料，并通过优化基板铜层的表面，贴装材料固化工艺和有机材料的叠层工艺，实现了可接受的过程。
无分层的芯片贴装截面【6】在除了以上跟芯片贴装相关的精准控制要求之外，在进行大面积高数量激光钻孔的对准上也极其挑战。硅桥表面的铜引脚尺寸在50微米左右（或更小），而间距（pitch）可能在70微米（或更小）。因此对激光钻孔机器本身的对准要求极高。如激光开口无法与硅桥上的铜引脚对应（部分对应也不行），在之后的阻抗匹配和信赖性的表现上就有可能会出现问题。当然，除了激光通孔，也可以使用掩膜版光刻的形式去形成对位孔，采用物理刻蚀的方式去形成通孔，而intel采用何种工艺估计会根据孔的密度来进行选择。
埋入的硅桥需要精准的激光钻孔对位【6】在实现上下通孔后，要实现互联的工序就是进行化学及电化学铜沉积，这在基板工艺中是成熟工艺。但通孔的尺寸实在是很小，对填铜工艺是有挑战的，当液体无法进行充分的离子交换，填铜的速度在整个500mmx500mm的大板中沉积的速度不一样时就会导致不同的填充厚度。同时水平和垂直电镀线的药水和工艺能力也存在较大差异，相信intel在开发过程中在这一工序上没少尝试。
硅桥上填充的铜通孔【6】 intel自家的技术自然也在自家的产品上积极运用。针对超级计算机和人工智能应用，intel在2019年公布了基于xe架构的芯片系统-真的是一个芯片系统，非常多芯片。该系统被命名为ponte vecchio，是用于高性能计算的下一代加速器。它结合47个magical tiles，主要由compute tiles、base tiles、rambo cache tile和xe link tiles组成，每个tiles都使用不同的制程制造。关于该芯片的命名，来源于意大利佛罗伦萨最古老的桥韦基奥桥（ponte vecchio），桥最初是以建筑师的名字命名的，类似我们中国贵州的风雨廊桥。而intel以此桥为名字，想必是为了体现该系统的经典和复杂，因为在现实中这座桥和周围的建筑是一个拜占庭式的庞然大物，桥的两边是当地的特色建筑，它们通过这座桥以巧妙的方式相互连接，形成这么一个古老而又有特殊建筑风格的大师级作品。
intel芯片架构及ponte vecchio集成（source: intel）在ponte vecchio芯片中，不仅有emib，还有foveros，可谓是当今3d集成度顶尖的芯片案例。美国能源部超级计算机aurora将以ponte vecchio为核心的，每个ponte vecchio系统每秒能够进行超过45万亿次32位浮点运算。四个这样的系统与两个sapphire rapids cpu一起构成一个完整的计算系统。超过54000个ponte vecchios和18000个sapphirerapids组合在一起，形成aurora。
ponte vecchio高性能加速器gpu 及其emib结构【7】当芯片节点来到5nm，仅仅通过硅工艺来延续摩尔定律似乎已经捉襟见肘。台积电和intel用先进封装结合硅工艺给半导体行业带来了新的范式，通过先进封装系统集成给摩尔定律的延续，提供了一种新的方向。

Cree的SiC晶圆供应
PLC的编程设计方法
什么是LDO？LDO中的噪声和PSRR介绍
e络盟LOGI开发板：可为树莓派与BeagleBone开发板提供FPGA功能
三星将5G技术融入汽车，C-V2X技术与多家汽车制造商展开合作
从苹果M1 Ultra看先进封装技术
DOSS的智能化探索聚焦人工智能打造可移动智能音箱
UVC芯片简单的挑选规则
锂离子电池第一次充电时间要多久锂电池正确充电方法
全面屏下前置电容式指纹识别技术即将被淘汰
硕果累累福禄克亮相世界传感器大会
意想不到的轻薄：宏碁Spin7的Intel七代i7变形本
半导体材料：GaN（氮化镓）的详细介绍
Chiplet，半导体能否实现弯道超车？
全球半导体硅片市场发展情况分析
新时代城市机关党建工作经验交流会在扬州召开易华录党委副书记、总裁高辉发表演讲
无刷电机的主要部件
VTI公司的压力传感器让飞行员手表实现了精确气压和高度测量的功能
电源系统设计优化秘技
现代汽车自愿召回KONA EV解析