“端到端”上车,小鹏能保持智驾领先吗?

衣衣谈汽车 2024-05-23 14:26:40

5月20日,小鹏汽车全量推送AI天玑系统,其中最引人瞩目的更新是“国内首个量产上车的端到端自动驾驶大模型”。

在特斯拉FSD v12的引领下,将之前主要由人工代码组成的规控模块替换为神经网络,从而转向全链路的“端到端神经网络”,甚而最终将感知、决策、规控融于一个单一的神经网络,已成自动驾驶行业公认的技术趋势。(推荐阅读:)

然而在实际落地层面,国内的现状还很“骨感”,大多数厂商仍在前期探索阶段。

以端到端模型驱动的自动驾驶系统,是AI 2.0时代的开始,也是实现具身智能、通用机器人的基础。

在实现的过程中,若将分模块的、初步的端到端量产上车视为一个节点,小鹏在中国厂商当中取得了阶段领先的位置。

要想继续保持并扩大领先优势,小鹏需在节奏、人才、资金等方面直面挑战,特别是在产品上持续发力。

小鹏的自动驾驶端到端大模型由感知模型XNet、规控模型XPlanner和大语言模型XBrain组成。

XNet负责感知,是一个聚合了动态XNet、静态XNet和纯视觉2K占用网络的“三网合一深度神经网络”,小鹏描述其为“鹰眼视觉”,称其能让自动驾驶系统如同裸眼3D。

其中,2K占用网络用超过200万个网格重构世界,对现实世界中的可通行空间进行3D高真实度还原,清晰识别静态障碍物的细节,使得感知范围提升2倍、面积达到1.8个足球场大小,能精准识别50+个目标物。

AI大语言模型XBrain负责意图推测,作用相当于人类大脑。它可以处理复杂甚至未知场景,具备对真实物理世界的宏观逻辑的推理能力。

在XBrain的加持下,自动驾驶系统能够识别待转区、潮汐车道、特殊车道、路牌文字,并懂得各种令行禁止、快慢缓急的行为指令,做出兼顾安全和性能的拟人驾驶决策。

小鹏此次实现端到端量产上车,最核心的更新是规控模块替换为神经网络模型。

XPlanner规控大模型,被小鹏类比为人类的小脑。通过海量“五星司机”的驾驶数据进行训练,使其驾驶策略不断向拟人进化,并拥有“老司机般的脚法”。升级后,小鹏智驾前后顿挫减少50%、违停卡死减少40%、安全接管减少60%。

在端到端架构下,上述三个模型可实现联合训练标注,带来的主要收益包括:

解决手写规则无法穷尽的corner case,让自动驾驶系统在面对罕见的道路场景时也能安全应对“开法更像人”,去除纵向加减速时的顿挫感和横向转弯/变道时的突兀感实现数据驱动,快速迭代系统的能力

而要想获得这些收益,高质量数据和超大算力资源是必要前提。

小鹏汽车介绍称,基于折算10亿+公里的视频训练、超646万累计公里数的实车测试、超2.16亿累计公里数的仿真测试,小鹏端到端大模型可做到2天迭代一次,在未来18个月内智驾能力提升30倍。

为支撑这样的研发强度和训练规模,2024年,小鹏汽车将在“以智驾为核心的AI技术”上投入35亿元用于研发,并新招募4000名专业人才,今后每年还将投入超过7亿元用于算力训练。

1亿美元算力投入,为小鹏储备了7000张英伟达A100。何小鹏认为,与美国科技巨头动辄数十万张卡的算力规模相比,7000张卡在中国企业当中已是屈指可数。

对于端到端架构带来的变化,何小鹏表示,大模型将对智能车带来颠覆性变革,“不是百分之几十的比例型变化,而是数十倍。”

这让他对小鹏智驾的信心更强、对实现自动驾驶的前景也更乐观了。

“今年以前,我以为中国的全无人驾驶还需要很多年。今年端到端大模型上车后,从数据看我觉得真的有机会在数年内实现全无人驾驶。”

基于这样的判断,何小鹏在发布会前后用多种不同方式表达了未来两年小鹏智驾能力提升的目标:

“2024年第三季度,小鹏汽车的智驾将可实现“全国都能开,每条路都能开”,2025年实现城区智驾体验比肩高速智驾。”

“希望未来12个月内,小鹏汽车的AI代驾能力和自动驾驶能力能有10倍以上的提高。”

“智驾能力未来18个月提升30倍。”

“2025年,小鹏汽车将在中国实现类L4级智驾体验。”

端到端的量产上车究竟难在哪?为什么在国内率先实现的,又是小鹏?

智驾系统的量产上车包含繁杂的工程化任务。这里举“无图”为例,从一角窥探端到端上车的难度。

何小鹏将小鹏汽车的智驾技术总结为三代:第一代依赖高精地图,第二代尝试部分无图,第三代(即今天的状态)实现全面无图和端到端量产上车。

“用高精地图就不能做端到端。”——元戎启行CEO周光曾在北京车展前的一场分享会上断言。

周光进一步解释说,神经网络类似于人脑,人脑擅长看非结构化数据,比如我们看看图、听听音乐是很牛的,但看数字,比如算233×176,肯定无法立刻算出来。这种东西人脑是不擅长的,但计算机擅长。高精度地图就是给计算机看的东西——你把它拿出来看,高精地图是一堆线段,每个线段都是X、Y,一个高精度地图给你的可能是100行或者500行的矩阵,人脑无法知道那是什么意思。但如果我告诉你“请左转、请右转、请变道”,这是人脑能接受的。做端到端,要给它看人脑看的东西——在自动驾驶的语境里就是大量的视频。

完全无图的系统,类似于人脑(+眼睛)对驾驶环境做实时感知,这才具备了做端到端的基础。

从这里也能得出一个观察:虽然端到端摒弃了数以十万计的规则代码,完全颠覆了先前版本的架构,但此前以规则为基础积累的研发成果并不白费,反而是实现端到端的前提条件。

没有一个成熟的模块化系统,想要一步到位做端到端,将会无从下手。

另一个支持该论点的领域,是端到端系统的安全兜底。

神经网络是一个黑盒,输出的结果具有不可解释性。在实现“光子进、控制信号出”、将驾驶任务完全交托给神经网络之前,在当前分模块的端到端架构下,仍需有基于规则的安全兜底方案。

小鹏智能驾驶负责人李力耘在谈到“端到端系统出现问题时如何追溯”时介绍道:

“端到端AI大模型,类比人的眼、耳、口、鼻、大脑,是一个有机结合、分工合作的主体。我们提出的架构不仅上限有保证,下限也有非常好的兜底……不同模块的模型,侧重点不同,比如XBrain侧重于大场景的认知,XNet侧重于精准感知和语义,XPlanner侧重于轨迹规划。如果在工程实践中出现了问题,根据具体问题的属性,可以很容易地定位到相应的那个模型,从而针对性地解决问题……这是小鹏能够量产端到端的重要前提——我们之前的所有努力,都是可以用来兜底的东西。”

也正是源于对自身研发积累的认知,何小鹏对未来的竞争很有信心。在回答“小鹏如何在大模型时代保持领先”的问题时,他说:

“自动驾驶是一个非常困难的事情,不是靠人、靠钱就能做到。它有非常大的数据、算力的门槛,而且越往后头部效应越明显。过去一年,好多公司跟随小鹏去掉高精地图,但没有成功,这个技术难度远超原来的高速NGP。以前我们自动驾驶的规则只有10万条这个级别,现在我们用大模型可以做到10亿条规则或者更大——当然不能完全这样同比,因为它是一个推理的模型。但实际上,它的逻辑完完全全跟以前的道路不一样。所以我认为,包括小鹏以及少部分其他的企业,会将绝大部分在做以规则为主的智能辅助驾驶(的企业)甩得越来越远。”

笔者认为,小鹏汽车在智能驾驶领域的技术领先,是长期坚定投入的结果、是可贵的优势。要想保持乃至扩大这项优势,小鹏要面对战略节奏、人才、资金等一系列挑战,而解题的核心应是聚焦产品。

自动驾驶的确是一个头部效应越来越显著的赛道,最终不会有太多的玩家存活。

海量训练数据需要由庞大的销量规模做支撑,而不断扩张的算力需求是一头“吞金兽”,需要持续的巨额资金投入,亦即健康的毛利率和庞大、持续的营收。

当然,正如何小鹏所说,自动驾驶研发的超高难度,决定了并非有钱、有人就能成功。

小鹏汽车的优势,是工程进度的领先、技术架构的先进,以及丰富的经验(趟过的坑)。这些经验能力会帮助其在数据的处理、训练资源的调配、算法的剪枝等等环节上更具效率。

但不容忽视的现实是,经验与能力的累积取决于团队的留存和发展,而只有企业销量稳步上升、经营状况健康持续的状态,才有利于核心人才的稳定留存。

能否从产品定义开始,直至产品生命周期结束,打造产品力上乘、销量坚挺的爆款车型,将会是小鹏汽车成败的关键。

好消息是,5月21日,在公司2024年Q1财报会议上,何小鹏表示今年小鹏将会进入强产品周期。除6月推出MONA首款车型之外,还将在Q4推出新款B级轿车,二者将覆盖10-15万元级市场;未来3年,小鹏将推出10多款全新车型,覆盖10-40万元级市场。

有关营收来源的另一个好消息是,小鹏汽车与大众的合作,正在为其带来更多收入:

Q1财报中包括1.4亿美元的“服务及其他收入”,同比增长93.1%、环比增长22.1%,占总营收比例达15.3%,主要得益于设计与大众集团的平台和软件战略技术合作带来的技术研发服务收入。

小鹏表示,这一收入将会是经常性的,“与大众EE架构的合作收入将从下半年开始确认,未来几个季度的收入将超过Q1。”

此外,小鹏汽车副董事长兼总裁顾宏地还在接受外媒采访时表示,小鹏将向其他汽车制造商提供自动驾驶和电动汽车技术,从而为公司创造新的收入来源。

何小鹏也针对做智能驾驶Tier 1的前景发表了自己的看法:

“传统的Tier 1卖辅助驾驶,后面只是做Bug Fix或少量更新,但是大模型需要大量的数据且让数据循环起来。就小鹏而言,一年花在算力和训练上的费用就是1亿多美金……所以,用Tier 1做集成商,在以前的软件时代是可以的,但在大模型时代非常困难,因为整个合作的方式都会有质的颠覆。”

特斯拉也在反复提及向传统车企授权FSD的可能性。

与不拥有自己车队的第三方供应商相比,特斯拉、小鹏这样的智能车企做智驾供应商,无需面对数据来源、数据归属权等问题。但截至目前,智能车企授权智驾系统,仍是一个潜力巨大但可行性未得到验证的模式。

结尾

能够确定的是,只要小鹏汽车能取得商业成功,小鹏智驾就会保持领先。因为这是一家对自动驾驶技术怀有信仰、将实现无人驾驶排在最高优先级的企业。

当回答各家的大模型会有怎样的差异时,何小鹏和李力耘都反复提到了用户体验、用户价值,表示这些才是最终的判定标准。

· END ·

0 阅读:24