苹果造车项目被曝搁浅后再整大活,无需真实数据就能训练自动驾驶。
苹果最近将自博弈(Self-play)引入自动驾驶,获得了很好的鲁棒性。
所谓自博弈,思想有点像自对抗生成网络(GAN),是指智能体在与自我的副本或历史版本博弈实现进化,这是强化学习领域的重要策略。
早前落地了游戏领域、机器人和生物工程领域,现在苹果将其用于自动驾驶,设计了极简的奖励函数,无需真实数据,而是生成“前所未有规模”的模拟数据,让若干智能体在地图上大乱斗,实现算法进化。
苹果造车项目被曝搁浅后再整大活,无需真实数据就能训练自动驾驶。
苹果最近将自博弈(Self-play)引入自动驾驶,获得了很好的鲁棒性。
所谓自博弈,思想有点像自对抗生成网络(GAN),是指智能体在与自我的副本或历史版本博弈实现进化,这是强化学习领域的重要策略。
早前落地了游戏领域、机器人和生物工程领域,现在苹果将其用于自动驾驶,设计了极简的奖励函数,无需真实数据,而是生成“前所未有规模”的模拟数据,让若干智能体在地图上大乱斗,实现算法进化。
作者最新文章
热门分类
汽车TOP
汽车最新文章