【50美元打造S1模型,DeepSeek开启技术平权,AGI时代要来了?】

又琴说世界 2025-02-07 15:01:22

【50 美元打造 S1 模型,DeepSeek开启技术平权,AGI时代要来了?】 科技圈又爆猛料!当地时间2月6日,美国李飞飞团队官宣仅耗费 50 美元,就成功开发出人工智能模型 S1,且在数学与编程能力测试中,表现堪比 OpenAI 的 o1和DeepSeek 的 R1 。 S1 的诞生运用了 “蒸馏” 技术,简单来说,就是让模型模仿学习其他模型的答案,进而提炼出推理能力。为训练 S1,团队准备 1000 个问题及答案,借助 16 块英伟达 H100 GPU,不到 30 分钟便完成训练,成本约 20 美元。升级版 S1 还能自我检查,以获取更精准答案。 不过,S1 的诞生也伴随着争议。一方面,它并非从零开始训练,而是基于阿里云通义千问(Qwen)模型进行监督微调;另一方面,训练所用的 1000 个样本数据,按照业内标准实在太少,通常难以训练出具备强推理能力的模型。 但我认为从深层来看,这背后的关键力量是 DeepSeek 开启了 AI 技术平权。在过去,AI 研发成本高昂,技术门槛极高,多数团队难以涉足。而 DeepSeek 将大模型开发成本降至传统方法的 1% - 5% ,性能却能达到 90% 以上,让更多开发者和团队能够参与到 AI 模型的开发与优化中,极大地加速了 AI 迈向 AGI 时代的进程。 S1 模型的诞生,无论争议如何,都是 AI 发展的一个标志性事件。DeepSeek 掀起的技术平权浪潮,也将持续推动 AI 朝着 AGI 时代大步迈进。未来 AI 领域还会有哪些惊喜?让我们拭目以待! 人工智能 S1 模型 AI 技术平权

0 阅读:13
又琴说世界

又琴说世界

感谢大家的关注