只说当下,如何分辨开车的是人or机器?
遇到红绿灯,或多人路口左右转时,车辆停止/减速后快速起步,并且灵活躲闪,中间无顿挫,十分丝滑的就是人;而如果频繁顿挫,起步又急刹,甚至在路口不知所措,多半是机器。
虽说是经验之谈,但本质上涉及当下高阶智能辅助驾驶的痛点——corner case。
如果将交通状况分为日常和特殊,就很好理解了。
大多数日常状况,都能通过建立数据模型,来为智驾车辆提供解决问题的模板。而遇到特殊现象就比较棘手,数据库中万一没有好方案,智驾系统只能不知所措。
武汉司机亲切地称为“勺萝卜”的萝卜快跑,就经常因此在路上“发呆”。
如何解决corner case,即处理特殊状况?目前业内的工程师都在用“笨办法”,即收集数据,提取,贴上解决方案,再OTA推送。下次其他车辆遇到同类问题,就有了参考模板。
还有一种聪明的办法,就是让车像人一样,获得“直觉”。也是端到端为啥有用武之地。
一段式端到端,打造完整神经网络
直觉的基础之一是经验。如何让车辆拥有更多有用经验?这里有两个关键点:
第一,比驾驶员看得更远更多;
第二,AI大模型的快速迭代。
相比人类的感知器官,汽车的感知元件更加灵敏。
以常见的128线激光雷达为例,它能在漆黑的夜里,探测前方400-500米距离内的物体,并且高度还原空间信息,对扫描到的物体进行准确识别。
再加上毫米波雷达、超声波雷达,以及多达十数颗的高清摄像头作为辅助。汽车获取周边环境的能力,要远远强于人类。
智己IM AD 3.0依托这种天赋,能在中心城区面对横穿马路的行人、突如其来的水坑等路况,实现丝滑礼让、轻松绕行。
如果在硬件感知范围以外,该怎么办?
智己汽车IM AD产品高级总监脱悦举了非常生动的例子:当车辆路口左转绿灯,却遇到同为左转车道的车辆停在路口,系统会根据经验,判定盲区内可能存在行人,进而减速慢行,以防“鬼探头”。
在智驾系统运行时,IM AD智驾的“安全逻辑网络”,时刻对智能驾驶行为进行监测和评估,确保它的驾驶动作足够恰当和安全。
为了让智驾系统能像人类一样,不断学习、迭代,智己IM AD 3.0携手Momenta联合打造了“一段式端到端大模型”。
和普通大模型不同,一段式端到端大模型不再依赖传统的分模块结构,而是将感知与规划整合进一个大模型中,通过数据飞轮提供的海量有价值数据,训练出一个完整的神经网络。
该神经网络能像人脑一样,具备分析全局信息、识别隐藏信息、学习人类优秀驾驶习惯等能力,从而在用车场景中形成和人脑类似的直觉反应。
直觉的基础是经验,经验的积累需要时间和金钱,也就是不断买服务器堆云端算力。此前,特斯拉曾向外界公布,计划到2024年底实现100E FLOPS的算力,预计采购成本超过30亿美元。
如何节约成本并缩短时间,智己与Momenta的工程师又想到了“长短期记忆模式”架构。
人脑每天要处理很多事,但并非每件事都被保留。这是因为人脑的工作算力和工作记忆能力非常有限,往往只能处理手头一件事。
一些有长久价值的经验,会转入长期记忆,大部分工作记忆很快“清空”,节省大脑资源。
智己的智驾也类似,将不同场景归类,根据出现频次分配至不同的记忆中,再给到对应的算力和储存空间,节省算力。
像老司机一样的“直觉”,从这里诞生。
L4级智驾实测,机器比人类更顺畅
今年7月和9月,智己分别已经获得“L4级有驾驶人城区道路测试牌照”和“L4级有驾驶人城区示范应用牌照”。
为了展示自己在自动驾驶领域的成果,在智己智能驾驶体验日现场,主办方准备了3台搭载有L4级自动驾驶系统的车型,供参会者深度体验。
测试车型为智己L7,具备4个激光雷达(量产车有2个),分别对应前后左右4个不同方向。
外观上,车载激光雷达模块还处于测试阶段,与车辆并不那么匹配,更像“外挂”。
虽然已经具备理论上的L4自动驾驶能力,但为了安全起见,主驾位还需要配备一名安全员。
从酒店门口出发至公共道路的200多米距离,需要安全员人工干预,而当车辆进入公共道路,就能拨下换挡杆,激活L4级自动驾驶功能。
体验过程中,车辆的转向、变道、加速、制动都非常丝滑。红绿灯停车等待再起步,遇到斑马线行人主动避让甚至减速,这些“基操”都没问题。甚至在起步或变道后系统还会“猛踩一脚”电门,让它有老司机的驾驶感。
只是在拐弯进入主路,遇到24小时限行的快速公交车道时,它似乎一时半会没反应过来,借道了2-3百米后,直至前方左转车道才驶出,存在吃罚单的风险。
换个角度来看,这也是老司机的日常操作,L4级自动驾驶确实值得期待。
虽然L4级自动驾驶还处于测试阶段,但在发布会现场,智己汽车联席CEO刘涛宣布,智己将在2026年正式具备L3级自动驾驶方案量产条件。
结合已经实现量产的L2级智能辅助驾驶,和正在测试阶段的L4级自动驾驶,智己将成为全国首个具备L2\L3\L4级智能驾驶量产能力的汽车品牌。
“智己早在2021年就提出通过数据驱动的方式去解决很多问题,而不是通过一些算力叠加来实现领先的功能。当我们的智己车开始跑得越来越多,同时AI生成的场景也越来越多,云端算力也会同步增强,迭代速度也会越来越快。”早在8月底的成都车展,刘涛就已经在媒体面前透露了用车主实测和AI生成两种方式,“喂养”数据模型的办法。
随着用户数量的倍增,以及算力的增强,拥有高效数据利用率的智己,在智驾方面大有后来者赶超的气势。
结语
“高阶智驾并非遥不可及,就在即将到来的2025和2026年。”
上述结论看似夸张,但以现在为原点,回顾2022和2023年,是不是觉得当下众多车企已经实现的L2.9级智驾不可思议?
目前,智己正在欧洲进行L2+级智能辅助驾驶的道路测试,目标是将无图NOA带向全球。
“智能电动车一定会像3C手机一样,一年一迭代是发展方向。”刘涛几个月前掷地有声立下的Flag,如今智己正在将它变为现实。
让我们猜一猜“全球都好开”的智己IM AD什么时候到来?