在智能驾驶技术日新月异的今天,“端到端”的概念如同一股强劲的东风,正席卷整个中国汽车智驾行业。当2024年的下半年悄然开启,车企们若未能在智能驾驶领域提及“端到端”,似乎已悄然落后于时代的浪潮。而就在这股浪潮中,理想汽车以一场别开生面的发布会,正式加入了这场“端到端”的竞赛,尽管目前还只是PPT展示,但其展现的技术蓝图已足够引人注目。
7月5日,理想汽车揭开了其基于端到端模型、VLM视觉语言模型和世界模型构建的全新自动驾驶技术架构的神秘面纱。这不仅是理想汽车对智驾未来的一次深度探索,更是向外界清晰传达了其智驾技术发展的下一步战略方向。
激进还是前瞻?理想的“端到端”路径解析
理想汽车的自动驾驶技术架构,独特地引入了“快系统”与“慢系统”的协同工作模式,这一灵感源自诺贝尔奖得主丹尼尔·卡尼曼的快慢系统理论。快系统,即系统1,如同人类驾驶中的直觉反应,能够迅速应对95%的常规驾驶场景;而慢系统,即系统2,则更像是深思熟虑后的决策,专门处理复杂或未知的交通状况,占据日常驾驶的剩余5%。
尤为引人注目的是,理想选择了更为激进的One Model方案作为系统1的端到端实现路径,这与华为、小鹏等企业的分段式方案形成鲜明对比。通过摄像头、激光雷达等多传感器融合,理想的自动驾驶系统能够直接输出行驶轨迹,控制车辆行驶。而特斯拉虽也采用One Model方案,但其“输入图像、输出控制”的方式更为直接,理想则在此基础上加入了车辆状态信息和导航信息,进一步提升了系统的智能化水平。
VLM模型:自动驾驶的“副驾驶教练”
如果说系统1是自动驾驶的“执行者”,那么系统2中的VLM视觉语言模型则是不可或缺的“监督者”。这个拥有22亿参数的庞然大物,能够像驾校教练一样,时刻监督并优化驾驶行为。当检测到路面坑洼时,VLM会及时提醒系统1降速,并向驾驶员传达信息,确保行驶平稳。此外,它还能识别公交车道、潮汐车道等特殊路况,为自动驾驶系统增添了一份“人情味”。
仿真测试:双管齐下,确保万无一失
在自动驾驶技术的验证环节,理想汽车同样展现出了其严谨与创新的态度。不同于业内常见的单一仿真测试方法,理想结合了重建仿真和生成仿真两种技术路径,既有“真题”的严谨性,又有“模拟题”的灵活性,为自动驾驶系统的安全性和可靠性提供了坚实保障。
结语:理想的“端到端”之旅,才刚刚启程
理想汽车此次发布的自动驾驶技术架构,无疑为其在智驾领域的竞争增添了新的砝码。然而,技术的落地与成熟仍需时间与实践的检验。理想汽车能否凭借其独特的双系统架构和VLM视觉语言模型,在智能驾驶的赛道上脱颖而出,引领新的风尚?这既是对理想技术实力的考验,也是对所有关注智能驾驶技术发展的消费者和行业的期待。在这场充满未知与挑战的旅程中,理想汽车已经迈出了坚实的一步,而未来的路,还需他们继续探索与前行。