一文看懂韬定律—以及背后的故事

这两天华为芯片部门老总何庭波在一个论坛上宣布的韬定律一石激起千层浪,不仅占领热搜,还迅速成为各个聊天群的热点话题。在自媒体上一下子冒出了很多专家大谈特谈。而不同专家的观点差异之大,也是前所未见。 有人说这是中国在芯片产业的革命性进步;有人说相关的技术早已有之,华为只是做了系统性整合然后起了个名字;还有人说,完全就是新瓶装旧酒,就是华为自家的广告文宣。

前天在台湾的一场英伟达供应链伙伴晚宴上,英伟达老总黄仁勋被记者追问,简单回答了几句,更是触碰了华点。技术群里各种吵架,围绕着老黄的说法争论不休。相关领域的行业人员都吵成这样,公众更是满头雾水,韬定律到底是个啥?到底是革命性进步?还是一群骗子?本文借此展开讨论,希望能够帮助读者理解这背后的故事。一家之言,仅供参考。

按照网上的视频,老黄当时的原话(中文翻译)是:这是华为的一项突破,台积电一直在用裸片(die)堆叠和3d封装和混合键合技术已有将近十年,台积电在裸片堆叠和混合键合技术的应用已经非常成熟。华为采用这项技术,能够实现两倍,三倍,甚至四倍的晶体管数目增长,而无需缩小晶体管制程,这是一项非常好的技术,但是台积电和台湾地区早已掌握了相关技术。

这段话一边说华为是技术突破,一边说台积电和台湾早就有了,这体现了老黄做人的圆滑之处,毕竟刚吃完台湾供应链的晚宴。但是断章取义的自媒体们各取所需,有人说是技术突破。有人说是台湾早就有了,吵的更加不可开交。

怎么理解老黄这段话?到底是突破,还是人家台积电早就有了? 一句话总结, 韬定律是芯片产业系统发展方向的范式转换,涉及到方方面面的技术,就包括老黄提到的裸片堆叠和混合键合,这些技术台积电也确实有了, 但是其中真正突破的部分,叫逻辑键合,这是华为独一无二,别家都没有的创新。

裸片堆叠,混合键合,3d封装,逻辑键合,可能外行人看来如同天书,要真正理解,需要对芯片制造生产,这个人类有史以来最复杂的技术产业做适度的了解。下文主要就此展开。

话头还是从大名鼎鼎的摩尔定律说起。摩尔定律是在1965年,行业杂志“电子学”35周年纪念刊上发表的一篇文章里提出的。文章的作者:戈登.摩尔当时是仙童半导体,这个半导体行业鼻祖公司的研发总监。文章标题是:  往集成电路里塞满更多原件, 也是相当的淳朴直白了。原文里最核心的一句话是:对应最低成本的芯片复杂度每年翻一番。摩尔预测这个趋势可能会持续十年。

所以,摩尔最早的意思其实是,成本不变,芯片里的原件数目每年翻倍(单个原件的成本下降一半)。十年之后的1975年,摩尔觉得芯片规模大了以后,进步速度会放慢,就把每年翻倍,改成每两年翻倍。芯片行业流传最广的说法,每18个月晶体管数目翻倍,并非摩尔本人,而是后来intel 的David House 提出的。 再后来,产业达成共识的摩尔定律综合了这些说法:在价格不变的前提下,每18-24个月芯片上容纳的晶体管数目翻倍,性能也会有相应的提升。

所以摩尔定律其实并不是大家通常理解的自然规律或者物理定律,而是一个基于商业观察,迭代总结出来的结论。摩尔定律就像是芯片产业给自己定的业绩指标,大家要一起努力,才能做到每18-24个月数目翻倍成本不变。 从摩尔定律提出到现在已经过了60年,指数定律的叠加效果是恐怖的。就算按照最保守的2年翻倍算, 在成本不变的前提下, 芯片的复杂度已经提升2的30次方,差不多十亿倍!

为了实现摩尔定律,必须不断增加芯片上的晶体管数目,业内的共识是要把晶体管做的越来越小。以晶体管的特征尺寸为指标,从几十个微米,到几十个纳米, 晶体管的大小越来越接近原子的大小。这就碰到了物理天花板,毕竟再怎么说,构成一个晶体管总不能小于一个原子。虽然在实验室里有用一个原子实现的开关,但实际上能稳定工作的一个开关单元最少也要包含几十到几百个原子,考虑一些不受控的量子效应,也许还要更多。现在几纳米的提法,并不是晶体管的物理尺寸,而是一种假定晶体管这么小,同样面积的芯片能包含多少晶体管的等效提法。

摩尔定律实际上包含两个要求,一是晶体管数目翻倍,二是单个晶体管成本降低一半。 实际上近些年的工艺进步只做到了第一点。为了把晶体管做的更小,必须研发更加复杂的技术和设备,而这些设备越来越贵,这就大大增加了芯片的成本。特别是从DUV到EUV,设备一下子贵了几倍, 制造芯片的成本也同样翻跟头增加,对应晶体管的成本不降反增。摩尔定律的一半已经不成立了。

既然晶体管已经很难做的再小,要增加晶体管的数目,应当怎么办? 不难想到,当平房住不下那么多人时,我们可以盖楼房,把芯片做成多层,这样不就一下子解决问题了?想法很直接,然而工程实现却没那么容易,因为芯片上的晶体管实际上是需要通过复杂的网络结构连接在一起的,现有的设计方案,都只能在平面上搞网络连线,不支持盖楼房。

为了把楼房盖出来,可以有不同的路径。最直接的是充分复用现有的技术, 先把一个芯片按照功能拆解成不同的部件,每个部件是一个平房,然后再把这些平房叠在一起,盖成楼房。其实这就是之前老黄提到的几个名词的意思,所谓裸片堆叠,3D封装,就是先做出单个平房, 再把平房叠在一起变成楼房。

盖过楼房的人都明白,每个户型如果都是方方正正,同样的设计,一样大小,楼房盖起来最简单。 因为水电管道通风井都是对应的,直接对接起来就好。其实3D闪存就是这种楼房,因为每个存储单元严格一致,可以相对容易的盖几百层楼房。 而普通的芯片例如手机的主芯片就复杂了,上面有各种功能组件,不同的单元组件大小形状都不同,要叠起来难度大大提升,所以这种芯片没办法像3D闪存那样盖那么多层,两层就挺难了。

再多说一句,所谓混合键合,就是把芯片对接面磨到原子级平整,平面上的铜焊盘相当于对接管道,铜周围的二氧化硅是建筑水泥材料,两片芯片铜对铜,二氧化硅对二氧化硅叠在一起,这样的好处是可以让芯片之间的缝隙极小,经过缝隙连接两片芯片的导线距离也相应变短。为啥要费劲做这个?这就涉及到华为提出的韬定律的核心思想,降低时延。

韬定律的韬,可以不严格的认为就是时延。因为信号在导线中以光速传播,就算导线距离很短,光的速度很快,也终究需要一定的时间。在芯片电路时钟频率极高的当下,这个时延已经是影响芯片整体性能的关键因素了。

所谓韬定律,大概的意思可以理解成,因为晶体管已经不能做的再小了,拿不到制程红利,得在时延上做文章,找空间要效益,用各种方法降低延时,就能保持芯片性能的持续提升。降低芯片上的延时,一种主要的技术手段就是减低晶体管之间连线的长度。 这其实就是韬定律背后,华为真正的技术创新: 逻辑折叠。 简单的说,就是让晶体管住上楼房,就算楼房只有两层,晶体管之间连接的距离也会比住平房时候短很多。举个容易理解的例子,小A和小B本来住平房的两头,小A要去看小B,得穿过整个平房,现在把平房从中间砍成两半,把其中一半翻过来叠在另一半上面,这样小A和小B就变成上下楼的邻居。只要过一层楼板就能见面,那距离自然是近了很多。

说到这里,有人可能会奇怪,这不是很显而易见的事情吗,为什么这是华为的独门绝活,别人为啥不做?道理其实很普通,这件事情说起来简单,做起来太难!为什么?

现代芯片制造发展了几十年,主要的技术积累都是在盖平房。实际上,对于手机芯片这样的SOC,内部包括一个个功能单元,做芯片的设计厂商不是每个芯片都从头开始自己设计,而是把一大堆现有的功能单元(IP)组合起来。

更具体一点来说, 假设你现在开了一家公司,要从头开始造一款SOC芯片。经过市场调研,你发现了市场空白并且专有技术优势。于是你定义了芯片的初始规格,包括芯片功能,接口定义,功耗,主频,面积,成本。这时你就可以选择合适的制程(影响功耗面积成本),同时选择生产厂家(没几家,一只手就数的过来)。决定哪些功能模块自研,哪些去市场上选购IP(也没几家,不同的生产厂商有不同的IP供应商偏好)。 选购好ip,签订合同后,拿到人家的设计文件,交给你的前端研发团队,进行RTL逻辑设计,并持续做各种逻辑功能验证,保证从模块,到子系统,到整个芯片无逻辑bug,测试覆盖率收敛,然后你就得到了网表,也就是器件单元的连接地图。

你把这个地图交给后端团队,后端团队根据你给的地图进行实际的物理设计,包括布局,布线,优化,时钟综合,时序优化等等等等。 在做物理设计的同时要做物理验证,需要拿到芯片生产厂家提供的物理参数库,就是针对工艺偏差,电压,温度(PVT)实际组合给出的工艺角(Corner),也就是K库。物理验证完成以后,就可以去找厂家流片了,这通常还要根据厂家的排期和自己的计划确认搭车时间和生产日期。最后从芯片厂拿到裸片(die)再交给封装厂封装成芯片。拿到成品芯片后,要先做一块功能验证的开发板,然后拿回公司上电,这是成败在此一举的决定性环节,成功点亮,你就可以让你的设计团队休假庆祝。如果失败,你可以考虑让技术团队连夜加班找问题,并且封锁消息,不让投资人知道…

好吧,回到主题,要做一款芯片涉及到很多环节,要和不同的团队,厂家打交道,拿到他们的设计和参数库,利用不同的工具软件,硬件仿真模拟测试平台做各种仿真验证。好了,现在问题来了,所有的这些软硬件工具平台软件合作伙伴和生产厂家,都不支持逻辑折叠!

你该怎么办?当然是想想就好,别认真,谁上谁死。所以逻辑折叠这条路是华为在没有别的路的情况下,硬趟出来的。

那么华为为什么在这个时候宣布韬定律?因为华为觉的已经把路趟通了,现在需要号召大家一起来干。就像摩尔定律虽然是摩尔提出,但是要凭借产业界的共识才能真正实现。韬定律要有发展,不能也不应该是华为一家的事情,也要产业界形成共识,大家一起努力。

说了这么多,可能还是有人不信,谁知道华为是不是挂羊头,卖狗肉?他真做到了吗?这样的问题现在无法回答。好在华为实践韬定律的第一款手机Mate90,   9月份就要发布了。华为的mate系列曾经是在9月份发布的,因为9月份苹果也发布新iphone, 当年的华为想跟苹果一决高下。可惜华为手机在巅峰时刻,受到了全面制裁,被芯片制造卡了脖子。于是华为只好蛰伏下来,默默的把mate手机发布日期调到年底,躲开苹果的锋芒。现在华为高调宣布又回来了。真的能对标苹果吗?韬定律会变成摩尔定律一样的产业方向吗?我们拭目以待!

发表回复