小马智行楼天城的这个很观点很有意思:
“人类司机可能因为严重身体问题失去驾驶能力,但人不接受机器失效。再比如一些鬼探头的场景,人类司机尽力了,有时可以是无责,但大家不接受 AI 这样。所以 AI 就算真的完美模仿了人类司机,也不满足人的要求。
越是优秀的人类司机,你向他学,越是反向优化。
因为人开车,是眼观四路、耳听八方,不是看传感器的数据,他有一些传感器没法得到的信息,包括他的经验。所以越优秀的司机,让他用传感器数据开车,(决策)偏差就越大。
这背后是 Learning by Watching 的局限,就是它是一个开环训练。这时,自动驾驶车辆无法自己判断是学得更好还是更差了,而向优秀司机学的策略,会放大系统和人类司机的输入偏差。这两个加起来,就会导致反向优化。”
端到端很火,大家挤破头,很可能多数是资源浪费,数据各家根本不能复用。端到端的挑战:需要大量车队参与的训练学习+高昂模型学习成本+必须持续迭代。
小米正在高薪挖人,搭建自己万卡集群,大模型团队成立之初是6500张GPU,都是财力…