美国试图全面掐断与中国的AI合作,中美将很快形成AI产业大面积脱钩。中国AI乃至大模型上车将受到限制。
文 /《汽车人》黄耀鹏
近日,美国财政部公布了新禁令,限制美国资本在中国半导体、AI和量子技术方面的投资。新禁令文本有165页之多。
禁令本身不令人意外,大致是去年8月总统行政令的细化措施。细则定稿将在8月份发布并实施。目前,中国是唯一明确列入禁令名单的国家。
AI制裁的底色
本轮禁令内容当中,要求美国个人和实体,不得与中国进行AI技术、产品的交易。美国正在与欧盟、英国盟友协调投资限制的范围。
比较新鲜的是,即使开发未被列入清单的AI系统和芯片相关交易,也必须向美国财政部报告。后者不仅意味着条款兜底,简直是预设了口袋罪。任何与中国公司“合法”(现行法条定义下)的AI或芯片交易,都可能面临问责、刑事民事处罚和投资撤回。
美国对中国AI的制裁,正从硬件过渡到软件,再过渡到人力资源和资本限制。一开始限制出售生产工具(光刻机、耗材)、产品(芯片),现在变成了所有研产要素的限制:算法、系统搭建、开发工具包、投资、智力交流,甚至可能蔓延到任何形式的合作。
虽然美国卡中国的AI脖子,形成了事实上的添油战术,但在美国政策方看来,限制中国AI产业的能力,是一个大目标,不可能一蹴而就,需要不断查遗补漏,最终达到严密封堵的效果。
现在,AI和芯片(后者被视为AI的子产业)赛道,虽然100%禁止交流是很难做到的,但中美将很快形成AI产业大面积脱钩,以后基本上各玩各的。当前除了中美,其他国家均已在AI全方位竞争中掉队(个别子领域领先无济于事)。这个赛道的第一集团,只剩下中美对决。
车企纷纷抢上“大模型”
当前汽车行业超越了“软件定义汽车”,开始流行“AI定义汽车”。这个拐点就是AI大模型上车。智舱和智驾,则是大模型在汽车应用的两个最重要场景。“双智”的融合也带有明显的、大模型促进的背景。
很多大模型都有美国技术、硬件和API接口的影子。现在美国试图全面掐断与中国的AI合作,“双智”的大模型融合、大模型驱动“双智”,会不会同时熄火?
这个问题评估起来有点复杂。
光是今年上半年,就有多个车企上线了大模型。
3月,理想发布了Mind GPT,相当于只是增强型语义大模型,强调互动,智驾功能尚未纳入该模型。
4月12日,蔚来上线NOMI GPT端云多模态大模型,优先对搭载Banyan·榕智能系统(比如,ET5、ET7、ES7等)的车型推送大模型。不过,这个大模型只有数十亿参数,叫“大”模型其实有点勉强。该模型重在AI场景生成,也就是针对智舱下手。
小鹏也在北京车展上发布了AI“天玑系统”,并在5月向X9、G6、G9、P7i四款车型推送。天玑系统融合了人机共驾、感知、出行助理和规控大模型,实际上是“双智”融合的雏形。
传统车企并没有落后。去年8月,广汽发布了广汽AI大模型平台。不过,这个平台更强调云端服务器的功能。昊铂GT上搭载的则是座舱大模型应用。
今年3月,百度也发布了Apollo视觉驾驶大模型。很多供应商,包括商汤科技、科大讯飞,都发布了自己的大模型。
4月,华为发布了“华为乾崑”一揽子智能解决方案品牌,将智驾、座舱、车控、车云都纳入到该品牌当中。
这么多大模型,无一例外都依靠海量数据喂养神经网络算法,使其在设定规则下自己成长。而多模态指的是数据形式,文本、音频、视觉数据。所有这些模型,和OpenAI发布的ChatGPT,只有构造区别,基本原理都一样。
硬件早已限制
顺便说一句,在美国政府禁令细则出来之后,OpenAI关闭了对中国的API接口。有人指出,这些接口去年3月就不通了。除了少数套壳GPT,国内大部分大模型,都可以跑通,并替代OpenAI GPT模型的接口服务了。
OpenAI从官方层面一断,国内的大模型服务商反而纷纷开始拉客户兜生意。这表明,国内的大模型,已经开始使用自己的AI工具,至少能自己搭建模型,自己调参,无须依赖OpenAI。
这是否意味着美国对中国AI乃至大模型上车的限制,毫无作用呢?还不能这么认为。
大模型最有力的应用,仍然是高阶智驾方向。无论部署在云端,还是车端,都需要算力卡作为硬件部署基础。
美国接连对英伟达产品限售,而英伟达每次都卡在新限制措施的下沿,推出符合规定的阉割版产品。“猫和老鼠”的游戏已经玩了多轮,让美国商务部长雷蒙有点不耐,声称要彻底停售英伟达对华出口,但就是没做这一步。
联想到美国给台积电南京工厂,发放长期有效、不受限制的生产许可(这事本身就挺魔幻的),就因为南京厂生产的是28nm制程芯片。
美国人的策略很清楚,中国能造的产品,就搞倾销,利用先发和良率优势卷死中企;中国不能造的,则严防死守,防止中企获得相关能力。这个研判,有滞后性,也有误差。
硬件受到制约之后,所有车企用户,都被迫采购华为的算力卡(搭载昇腾AI芯片)。虽然华为高管声称昇腾芯片性能优于英伟达A100,但多数客户们并不这么看。不过,这不妨碍他们排队等货,因为没有其他选择。
打断大模型迭代进程
算力硬件限制是去年的老黄历。当前限制集中在投资和智力交流上,即美国资本和个人不可以投资中企,也不可以为中企提供技术支持。
这就带来一个新问题,继算力壁垒之后,美国又寻求算法壁垒。OpenAI对中国停服,就属于这类措施。
现在大模型转移到车端(端到端算法),特斯拉、小鹏、华为处于领先梯队。大模型端到端的方案,和此前业内沿用多年的感知-决策-规控路线不同,前者也是用大数据填喂模型,自己生成算法推送到车端,而不是靠人编写软件,规定每一个场景该如何应对。
小鹏CEO何小鹏最近还跑到美国,表示要亲身比对小鹏的XNGP与特斯拉最新的端到端推送FSD12.0,孰优孰劣。而最新的XNGP版本,基于小鹏5月份推送的端到端算法。
何小鹏也表示,特斯拉FSD的行为模式,建立在美国道路规则、美国司机群体驾驶数据之上。中国交通参与者的种类和数量,以及行为模式、路况之复杂,和美国基本没有可比性。
何小鹏认为,中国道路的复杂度是美国的10倍。这也意味着,美国数据填喂出来的端到端算法,如果直接拿到中国,会碰得一头包。如果想在中国运营端到端算法,就必须用中国数据填喂。反之,如果中国算法拿到美国,只需要稍加训练即可。
训练几乎每一个环节,包括数据积累、预处理、标注、方针、云端训练和裁剪,中国的优势“将”是全方位的。
说中国拥有大数据优势和数据训练优势,就是这么来的。从长期看,中企尤其是新势力,有能力训练出更接近完全自持的、高等级自动驾驶方案。
有人认为,“世界模型”将成为L5级自动驾驶的最优解。而“世界模型”的本质,是AI构造AI,后者是可以随时变化的(人类无须干预),从而形成解释世界的认知框架。
美国的政策制定者,未必清楚这一点,但他们所做的客观效果,是试图保有美国的先发优势(硬件和模型构型),而牵制中国优势(大数据、训练过程)发挥。
从时间角度,美国拥有的是已经兑现的存量优势,而中国的优势则需要在未来兑现。因为海量有效数据(重复场景数据是无效的)利用,是智驾能力快速提升的可靠路径。
本质上,美国试图打断这一进程。
现在各家端到端技术的应用,都处于早期。美国仍然保有上述优势。目前看,硬件限制反而是最容易找到替代的(毕竟性能差一点也不影响使用)。美国可能也是研判到这一点,才新增施加软件和服务限制。
大模型这玩意,尽管是人类算力达到一定水平之后自然产生的、解决诸多问题的路径,但其原始创意毕竟属于美国人。中企团队仍需要与美国同行频繁交流与合作,一方面需要探知“对方搞的怎么样”,即敏感前沿趋势;另一方面也希望交流中激发灵感和寻求一些底层方法论的点拨。
因此,如今的智力交流限制,很难像硬件被限制那样,容易做替代能力的评估。如果两方彻底各做各的,可能让中企更忧虑一些,总之不是好事。但该来的还是要来,去年就已经确定要全面限制,中企估计早就做好了心理准备。
在这场比拼中,没有投降输一半的选择。输掉的一方,将输掉未来。唯一的选项,就只能是寻求发挥自身优势,在大模型的竞争中尽快触及“完全自动驾驶”愿景的边缘,顺便让美国AI制裁无效化。【版权声明】本文系《汽车人》原创稿件,未经授权不得转载。