三美金实现AI顿悟:DeepSeek的GRPO算法再创奇迹,开源项目

英杰看世界 2025-02-06 15:05:37

三美金实现 AI 顿悟:DeepSeek 的 GRPO 算法再创奇迹,开源项目 Deep-Agent/R1-V 仅花了3美元在 8个 A100 上训练30分钟,就使一个20亿参数的模型在一项功能上超过了720亿参数的模型。随着 open-r1 开发的迅速推进,未来开源博士级 AI 将不断自我提升,彻底打破 AI 寡头们的垄断。过去数日,在人类终极测试(这是一个由美国顶级理工教授根据其研究领域设计的测试)中,多个 AI 模型取得大幅度进展。 OpenAI 的CEO 奥特曼在与网友对话中承认,DeepSeek 非常优秀,OpenAI 目前仍有优势,但优势会缩小。奥特曼也似乎表示,OpenAI 可能会开源。

0 阅读:13
英杰看世界

英杰看世界

感谢大家的关注