Grok Beta 增加了思考时间和思考痕迹,很多人据此猜测 Grok-3 也是一个 DeepSeek-R1 那样的推理模型。
但考虑 Grok-1 和 Grok-2,我猜 xAI 可能会走和 Anthropic 类似的路线,在 LLM 中增加强化学习的比例,针对不同难度的问题给出不同级别的推理能力,我是觉得这更合逻辑。
当然 Hello grok 是不需要推理的,这估计只是个测试案例。
Grok Beta 增加了思考时间和思考痕迹,很多人据此猜测 Grok-3 也是一个 DeepSeek-R1 那样的推理模型。
但考虑 Grok-1 和 Grok-2,我猜 xAI 可能会走和 Anthropic 类似的路线,在 LLM 中增加强化学习的比例,针对不同难度的问题给出不同级别的推理能力,我是觉得这更合逻辑。
当然 Hello grok 是不需要推理的,这估计只是个测试案例。
作者最新文章
热门分类
汽车TOP
汽车最新文章