在推特号称「绿神」的@greentheonly 最近公开了特斯拉最新hw4.0的硬件实物图片。
这些信息非常有价值,我们可以一窥hw4.0中二代fsd芯片的最新进展和相关技术水平。
hw4.0的硬件是「绿神」拆解自最新款的 model x 车型。
据悉,特斯拉hw 4.0或将在特斯拉举办的投资者日上正式亮相,并开始全系量产上车。
从硬件实物来看,全新的hw 4.0不仅拥有性能更强的芯片,摄像头分辨率、数量以及位置也发生了相应变化,同时 hw 4.0 还将新增一个4d毫米波雷达。
01
特斯拉二代fsd由三星代工,采用7纳米工艺
早在2021年,外界就有传闻fsd二代将由三星代工,也有一种说法是特斯拉与三星联合开发。
到了2022年下半年,又有传闻称fsd二代由台积电代工完成,且言之凿凿地说是5纳米甚至4纳米,还有消息称这是第一颗车载4纳米芯片。
特斯拉二代fsd芯片真身,根据芯片表面丝印的数字,编号h2238,可以推断出这是三星代工,并且极有可能只是7纳米,不是5纳米。
上图为初代fsd芯片,编号h1834
另外,green在推特上说「still samsung exynos ip」,这一点信息有误。
众所周知,三星自研cpu架构早在2015年就停止了,现在三星都是采用arm的公版架构,没有自主ip,并且初代fsd是三星代工的,所以用「still」,实际上是二代fsd仍然由三星代工。
芯片代工捆绑程度很高,如果一开始选定某家晶圆厂代工,需要双方合作建立该芯片制造工艺的library,想要中途改换,需要重建library,时间周期很长,最少需要1年时间,浪费大量研发成果。
特斯拉为什么选择三星?
主要原因恐怕还是成本——7纳米芯片,三星的代工价格不到台积电的1/3 甚至1/4,三星低价抢单后果就是晶圆代工部门营业利润很低,2021年大约 6%,2022年大约10%,而台积电是接近50%,是三星的5倍。
台积电的产能一向不宽松,相对于苹果、高通、英伟达和amd动辄千万上亿的出货量,特斯拉的订单台积电根本看不上。
5纳米,台积电更是完胜三星,3纳米也是如此。
无论闸极还是内联线宽,台积电都完胜三星。这意味着在功耗方面,三星比台积电逊色不少。
特斯拉选择三星,就不大可能选择还不太成熟的5纳米工艺,因为三星的5纳米比7纳米提升不多,功耗也偏高。
特斯拉选择三星只能选7纳米,因为工艺更成熟。
此外,还有地理优势。
特斯拉总部目前在德克萨斯州奥斯汀哈罗德格林路,特斯拉最大工厂也在奥斯汀,特斯拉cybertruck唯一工厂也在奥斯汀,而三星的晶圆代工厂跟特斯拉在同一个城市,也在德克萨斯州的奥斯汀。
准确地说是在奥斯汀略微偏北的taylor,离特斯拉并不远,双方可以互相高效沟通。
2021年11月月,三星响应美国政府号召宣布在美国德州投资170亿美元建立s2-2晶圆厂。
此前的s2-1工厂最高只有11纳米,s2-2厂可以到7纳米,预计2023年年初投产。
特斯拉的二代fsd芯片应该就在s2-2厂代工。
台积电在美国也在建厂,不过地址在亚利桑那州的大凤凰城,且在2024年底才能投产。
02
详解 hw 4.0,特斯拉第二代 fsd 究竟实力几何?
特斯拉hw4.0正面pcb如上图,green在推特上说二代fsd的cpu内核由12个增加至20个,运行频率在1.37ghz-2.35ghz之间。
初代fsd使用了12个arm cortex-a72 cpu内核。
a72 是 arm 在 2015 年推出的架构,性能大约为6.1-6.5dmips/mhz,最高运行频率差不多也是2.4ghz,像后来推出的a76、a77、a78最高运行频率可以达到3ghz以上。
从搭载cpu的性能来看,这也反证特斯拉hw4.0使用的还是2015年的 a72。
按初代频率2.2ghz计算,20内核a72的算力是20*2.2k*6.5=286k,与英伟达orin的12核心 a78ae比稍微低一点,orin是300k dmips。
与hw3.0 相比,hw4.0一个明显的区别是hw4.0元件更多。
hw4.0上下还各多了24路供电,尤其下面的12路供电,电感体积颇大,并联的钽电容阵列也颇为壮观(大概率是松下的高精度钽电容)。
hw3.0的供电只有4路,hw4.0则多了20路。我个人推测是因为二代fsd的功率大幅度增加了,估计每片二代fsd的功率是80-90瓦,甚至有可能是100-120瓦,否则没必要增加这么多路供电。
这同样也反证了二代fsd采用的是7纳米工艺。
为什么这么说?
这实际上与电脑主板供电类似。
上图是典型的电脑主板,完整的cpu供电设计一般都需要包含上述部分。
pwm芯片起到总控制作用,每一相完整的供电都是由:
1-2个电感(一般是并联或倍相的情形)
1-4个mos(一般是高级的dr.mos/2~4个就是常规的上桥+下桥)
数个滤波电容(中低端主板固态电容,高端主板用钽电容)等构成
电脑主板供电和车载运算系统供电是完全相同的:一般是开关电路。
开关电路是控制开关管开通和关断的时间和比率,维持稳定输出电压的一种供电系统,主要由电容、电感线圈、mosfet场效应管以及pwm脉冲宽度调制 ic 组成。
这一电路系统发热量低,转换效率高,而且稳压范围大、稳压效果好。
一般来说,功率65瓦的电脑 cpu 一般是4相或者6相供电,250瓦的显卡一般需要8相供电,500瓦的rtx 4070 ti显卡一般是12+3(12路gpu,3路显存),更为高级的是16+4路。
多相供电的好处很多:
提供更大的电流;
降低供电电路的温度,因为电流多了一路分流,每个器件的发热量自然减少了。多相供电电路可以非常精确地平衡各相供电电路输出的电流,以维持各功率组件的热平衡;
利用多相供电获得的核心电压信号也比单相的来得稳定。
但多相供电的缺点是成本较高,而且对布线设计、散热的要求也更高,因此功率越大的产品所用的供电相数越多。
特斯拉使用了24相供电(估计两颗fsd是18路,6 路是显存的),尽管采用了水冷,推测两颗fsd的功率仍然有大约150-200瓦。
而orin是多少呢?顶配64gb的orin agx最大功率为60瓦。
与hw3.0不同,hw4.0的背板多了8颗内存,fpga代号为d9zpr,实际型号是mt61m512m32kpa-14 aat:c,特斯拉不惜血本,用上了最顶级的gddr6。
gddr是graphics double data rate的缩写,为显存的一种。
gddr有专属的工作频率、时钟频率、电压,因此与市面上标准的ddr存储器有所差异,与普通ddr内存不同且不能共用。
一般来说,gddr比主内存中使用的普通ddr存储器时钟频率更高,发热量更小,更适合搭配高端显示芯片。
gddr则是电脑爱好者熟悉的高级显存,gddr6是英伟达2018年发布20系列显卡才开始出现的。
目前最强的消费级内存是2020年英伟达携手美光推出的gddr6x。
不过和ai训练用芯片普遍使用的hbm2内存还是差距明显,当然了,hbm2 价格远高于gddr6x。
车载领域目前都是lpddr,特斯拉又开创先河:第一次在车载领域用 gdrr。
为什么之前没有车企使用?
一是算力需求不高;二是gddr功耗高,用于车载领域并不适合。
不过特斯拉不在意,台式机的gpu都敢放在车里,更不用说功耗略高的gddr了。
lpddr参数
gddr6参数
gddr6最高运行频率远高于lpddr5,最高可达1750mhz,传输速率大约是12800mt/s,是lpddr5的两倍,代价是——功耗也差不多是 lpddr5 的两倍。
特斯拉不惜血本,用了16 gddr6,总计32gb,仅此一项成本就有大约200-250美元,hw3.0则是8颗lpddr4,总容量16gb,估计要20美元。
flash存储方面,hw3.0是东芝的thgaf8g8t23bail,这是32gb的ufs,不过是较为陈旧的ufs2.1标准。hw4.0改用三星的kludg8j1zd,容量提高到128gb,但依旧是ufs2.1标准。
03
二代fsd的算力有多高?
对于特斯拉这种one shot型的npu,增加算力就是增加晶体管数量,同样的die大小就要提高密度。
二代fsd的die面积看起来差不多大小,考虑到a72的核心增加到了20个,也会占用部分die面积,估计算力最多提高三倍,也就是216tops,仍然低于orin。
不过fsd的sram容量比较足,这是特斯拉一贯特色,二代fsd的实际算力和理想值会比较接近。
左边是hw4.0,右边是hw3.0
上面一层是座舱车机,下面一层是智能驾驶
单从接口看,hw4.0至少有两个以太网接口,从连接器判断是标准的单对线车载以太网,不是早期的eavb以太网。
在两片fsd下面似乎有两片车载以太网物理层芯片,应该是较新的 88q2112。
新增以太网接口正是为了对接特斯拉自己开发的4d毫米波雷达,传统毫米波雷达用can或can-fd连接,4d毫米波雷达信息量大,需要用百兆以太网。
板子中间最下方可能是以太网交换机,hw3.0是marvell的88q6321。
hw4.0显然不会在使用这种相对落后、非严格车规以太网芯片。
据推测,hw4.0应该换成了性能较为先进的博通bcm8956x或bcm8947x,也有可能是来自中国台湾瑞昱,因为车机板上的以太网交换机正是瑞昱的产品。
左图是hw3.0的智能驾驶接口。右图是hw4.0,上面一层是hw4.0的智能驾驶的接口,座舱有两个显示屏输出接口。
智能驾驶方面:
红色作为预留接口;
蓝色代表驾驶员行为监测。
白色为连接两个后向摄像头;
黑色为前视摄像头,可能两个都是500万像素。
我个人推测,特斯拉hw4.0减少了一个前视摄像头,增加了一个后向摄像头。
特斯拉用了两片4路解串行芯片,估计是美信的max96712,这个芯片在国内非常抢手。还有一片可能是2路解串行。
hw3.0则是两片德州仪器的ds90ub960和一片ds90ub954,尺寸明显比美信的要小。
其余地方差别不大,仍然是spansion的64mb nor flash做boot loader。
电源管理似乎还是美信的max20005。u-blox的gps被取消了,换成了更高级的三波段gps。
这是hw4.0的车机部分,将cpu与gpu合二为一,放在一张pcb板上。
车机背板,无线通信模组还是ag525r-gl,蓝牙与wifi还是lg innotek的atc5cpc001。
总结一下,hw4.0与hw3.0相比,进行了如下的更新:
(1)hw4.0比hw3.0的面积更大,集成度更高。例如hw4.0的车机部分,将cpu与gpu合二为一,集成在一张pcb板上;
(2)内核部分升级不大,hw4.0 cpu内核从12个增加到20个,最大频率2.35ghz,默认频率1.37ghz,trip内核数量从2个增加到3个,最大频率2.2ghz。
(3)hw4.0 npu芯片封装面积增大,供电部分加强,hw4.0功耗大概是hw 3.0的2倍;
(4)hw4.0开创先河,在车载领域率先使用gddr,hw4.0将显存升级到16g gddr6每核心,超过hw3.0每核心8g lpddr4,推测fsd整体算力得到3-5倍提升;
(5)在域控模块的pcb板上,摄像头接口增加:由hw 3.0的9个接口增至12个摄像头接口。具体来说,由原来的前置三目摄像头变为了双目,布局为:2个侧视摄像头,1个前摄像头、1个倒车影像摄像头、4个侧向adas摄像头以及座舱内的1颗摄像头,一共11颗,还有1颗备用摄像头。前向感知摄像头从120万像素提升到了500万像素。
(6)gps模块升级,使用了三频gps天线模块,新增l5频率,以提升定位精度;
(7)新增了毫米波雷达接口以及雷达加热器;
(8)hw4.0主板整体采用对称设计,配置均为双备份;
总体而言,hw4.0的升级主要集中在fsd芯片和传感器架构。
英伟达orin是2019年12月推出,特斯拉的二代fsd估计是2020年开始设计。
两相对比,谁更优秀,相信聪明的读者已有答案。
毫米波释放5G全部潜能
什么是土壤水势仪,它的作用是什么
NVIDIA Riva 2.0的功能亮点有哪些
智能外呼机器人能否提高人工电销的效率
AMD正式发布全新黑科技StoreMI
特斯拉最新HW4.0用了哪些芯片?
为什么DREP的愿景是成为区块链上的连接器和工具箱
电视面板持续降价,中小尺寸电视面板于第三季度有望止跌甚至涨价?
荣耀8、荣耀9对比评测:华为荣耀8、华为荣耀9怎么样?荣耀9提升在哪里?
华为HarmonyOS 4开始预热,8月4日或在HDC 2023亮相
物联网与智慧物流不能不说的那些事
杰华特联合英诺赛科推出120W氮化镓快充方案,打造大功率高端
传苹果拟自主开发射频元件
5G时代下的物联网,它的发展前景将是如何
投资度过金融危机可以不可以借助比特币来解决
LED驱动电源产业如何突破红海困局
亚马逊云科技助力传易短视频社交平台Vskit“红遍非洲”
智能音箱产业未来可期!
rs232串口接线图
哪些关键功能,锂电池高低温试验箱必须有