文/王新喜
最近有一个话题很有热,英伟达显卡这么先进,为什么我国不拆开英伟达显卡研究,从而造出自己的国产显卡?
显卡是游戏的衍生物,游戏在过去被认为是娱乐的代名词,但没想到它成了科技创新的强大推手,游戏是英伟达成功的关键,自1993年成立以来,游戏显卡是英伟达最核心的产品,发展到今天,已占据全球80%的市场,在过去,市场上那些对画面、制作质量要求非常高的游戏玩家,不断逼迫英伟达去开发性能更高的显卡,推动英伟达成为GPU领域的头号玩家。
在近20多年以来,英伟达研发投入一直在增长,研发支出几乎保持在20%~30%之间,远超美国科技企业3%的平均值。在游戏行业的拉动下,英伟达的GPU芯片性能高歌猛进。正是在游戏显卡领域积累的GPU底层能力,让英伟达赶上了AI的时代列车,为大量厂商提供顶级的GPU芯片。
发展到今天,英伟达目前在显卡市场已持续投入了几十年的研发资金和人力资源,形成了很高的技术壁垒。英伟达芯片内部的复杂度已经不是靠逆向可以研究出来的地步了。
中国的逆向工程研究一向非常强势,在国际上甚至有“什么东西只要被中国人看一眼,他们立马就能复制出来”的说法。靠着这项能力,中国少走了很多弯路,其实从中国的高铁技术、航空技术到盾构机等诸多产品的突破,都是依靠由逆向工程再到正向工程的实现科技创新与突破的路线取得了成功。中国逆向工程的“巅峰”时刻,是上世纪获得美国F4战机残骸的时候。当时中国曾靠4万块美机碎片获300项航空技术。
在显卡上能不能做到?
这种逆向工程拆解实现复制的想法,其实在早期有成功的可能性,早期处理器工艺还没那么复杂、还没那么先进的时候。比如英特尔的4004、8086等早期处理器,拆下来显微镜就能看清楚是怎么设计的结构,基本的门电路差不多都能认出来,而且由于功能简单,认不出来的也都可以补出来,因此这个时代是可以复制的。
但是现在的英伟达的CPU、GPU设计都动辄集成百亿、几百亿晶体管,结构复杂无比,不可能通过拆解认出来怎么设计的,只能通过X光透射大概了解其区域分区。至于复制,只能是天方夜谭了。
英伟达目前被制裁的A100 GPU,采用TSMC 4N工艺也就是5nm工艺制造,大约800平方毫米。
在5nm等级的工艺上,就算使用0.1nm波长的X光机,去扫描内部结构,得到大约540亿晶体管的内部图,但是由于芯片内部是3D立体的,存在多个层级,因此单纯的2D图像是无法还原内部结构的。它几乎在800平方毫米的地方集成了540亿的晶体管,在某些模块上还存在别人的特殊设计和特殊工艺。
这可不是简单的拆开就能研究清楚的,它是一个由540亿颗晶体管组成的微型“城市”。如果把每颗晶体管按照一平方米的面积列开来,那这一颗显卡核心的占地面积就几乎相当于3~4个北京市那么大。
肉眼肯定是无法看出这座城市的细节,必须借助显微镜才行。哈工大的顶级显微镜,有60nm的分辨率,但是英伟达的GPU核心可是用5nm或8nm工艺制作的。当然,我们用最先进的透射电子显微镜(TEM)足以观察到物理尺度为4nm的H100显卡中的晶体管,但问题来了,如何确定这540亿个晶体管各自的类型、精确的位置,以及晶体管之间的走线?
此外,英伟达设计出来之后,需要向芯片制造企业台积电提供芯片的GDS版图,根据GDS版图,在晶圆上经过光刻、刻蚀、离子注入、沉积、金属化等几十个步骤才可以制造出相应的芯片。
事实上,类似的问题,在发动机、光刻机等问题上曾经也有过类似的发问。难度还在于,这其中的工艺、材料、设备、技术等供应链来自于几十个国家。
况且英伟达的产品是硬件与软件的高度结合,在图形显示方面,GPU的图形驱动的好坏直接影响用户体验;在通用计算方面,CUDA及其各类高性能计算库提供了完备的支持,目前英伟达在软件上最大的护城河是CUDA,英伟达在CUDA方面下了极大的努力,而且这件事做了很多年,到今天CUDA可以影响很多领域,今天连OpenCL、Metal都没法撼动CUDA的地位,更别说去从0到1做生态了。
拆开英伟达的显卡进行逆向研究成本更高,自主研发创新更实际
没办法拆开英伟达的显卡研究,造出自己的国产显卡,留给我们的教训与反思是,逆向工程并不适用于所有产品和技术。现代芯片内部结构十分复杂,包含数十亿个晶体管。即使通过逆向分析,也很难理解芯片的具体处理流程、组织结构、功能特征和技术规格等要素,更难以仿制出功能相近的产品。
其次,在现在科技战中,一项技术的逆向工程研发与推进,在初期更容易成功,在前期技术壁垒尚未形成的阶段,尚可追赶,越到后期,难度越来越大。
其实要想做成功的逆向工程,这与研发人员的技术能力以及技术积累与工业化底子有关,一个成品拿在手里,技术人员以前得接触过这项成品使用的技术,才能知道这项成品在制造过程中用了什么技术。一旦技术积累拉开差距,这背后的产业链差距与软硬件生态差距也拉开了,伴随着一项科技产品的性能越来越强,晶体管越来越复杂,工艺越来越看不懂,逆向工程研发难度越来越大。
不过,在深度全球化的时代,英伟达也无法脱离中国产业链,中国是少数的同时拥有从芯片研发到生产制造,再到应用场景的,具备全产业链能力的国家,而英伟达的芯片中也有大量零部件产自中国,尤其是显卡算力越高,就越是依赖光模块这条技术路径。因为GPU运行,涉及大量数据传输和计算,光模块的作用就是,进行光、电信号转换。
为了满足AI大模型、科学计算等算力需求,每台服务器动辄需要数百甚至数千个GPU。2010年,全球10大光模块企业名单,中国只入围了一家。到了2022年,全球前10,中国就占了7个。
中国芯片全产业链的蓬勃发展其实本身为我们自主创新打下了很好的基础,因为芯片的换代速度非常快,可能在研究一代芯片时,下一代芯片已经面世,即使你成功做到了逆向研发,也有可能受制于IP专利侵权等知识产权问题,芯片制造代工厂也不敢接你的活。
因此,逆向工程的成本已经超过了自主重新研发的成本。我们现在国内芯片产业正在进行自上而下的整体规划,从芯片制造,到设计,从系统软件的基础建设,到应用侧的布局,进行全面的独立自主的信息生态体系建设,随着国内全产业链的能力布局越来越深,自主研发创新实现突围的路径要比逆向研发更实际,这也是为何国内没有必要在英伟达的显卡上做逆向工程的重要原因。
作者:王新喜 TMT资深评论人 本文未经许可谢绝转载
球经都不懂