理想汽车目前的智驾叫:端到端+VLM 那什么叫VLM,端到端是什么意思呢?还有后面的VLA是啥? 用大白话解释这两个技术概念: VLM+端到端就像给汽车装了两个大脑: 端到端系统是"直觉型大脑":看到红绿灯直接刹车,遇到加塞本能避让,像老司机肌肉记忆般快速反应 VLM系统是"思考型大脑":能看懂"前方学校"的标牌,理解"潮汐车道"的含义,像学霸分析交通规则 这两个大脑配合工作,就像人类开车时既要有条件反射的驾驶习惯(端到端),又要能理解复杂路标含义(VLM)。理想汽车的双系统方案,相当于让车同时具备老司机的经验和交通专家的知识。 VLA(视觉-语言-动作模型)则是更高级的形态: - 相当于把两个大脑融合成"全能司机" - 不仅能看懂路况(视觉),理解交规(语言),还能直接输出方向盘动作(动作) - 就像驾校教练直接帮你开车:看到"限速60"标牌,既知道要减速,还能精准控制油门力度 简单类比: - 传统智驾:像流水线工人,每个环节(感知/决策/控制)各干各的 - VLM+端到端:像配合默契的足球队,前锋后卫分工协作 - VLA:像梅西踢球,带球突破射门一气呵成 目前理想汽车的方案处在第二阶段,而VLA被认为是下一代技术方向,可能会让自动驾驶更像"老司机亲自开车"。
我作为一个10年驾龄,跑了50万公里的老司机来说,跑高速的时速,从一开始喜欢开到
【266评论】【49点赞】