AI创造营DeepSeek霸榜AppStore,被曝训练成本低至30

阎象谈娱乐 2025-01-27 09:30:51

AI创造营 DeepSeek 霸榜 App Store,被曝训练成本低至 30 美元

1 月 27 日,苹果 App Store 中国区免费榜显示,DeepSeek 成为中国区下载量第一。过去 24 小时内,DeepSeek 也曾登顶美区 App Store 免费榜第一,超越 OpenAI 的 ChatGPT。

而近日,来自加州伯克利大学在读博士 Jiayi Pan 的研究团队,成功地以极低的成本复现了 DeepSeek R1-Zero 中的关键技术「顿悟时刻」。

据悉,研究团队使用了 DeepSeek R1-Zero 的算法框架进行实验,同时团队选择了「倒计时」游戏作为实验平台。研究表明,即便规模较小的语言模型,通过强化学习(RL),模型也能自行发展出强大的自我验证和搜索能力。值得关注的是,研究团队表明,训练模型的成本低于 30 美元。

上述提及的「aha moment(顿悟时刻)」为 DeepSeek R1-Zero 中的关键技术。据 DeepSeek-R1 技术报告对该技术的介绍显示,通过 RL 框架,AI 可能自发形成类人推理能力,甚至超越预设规则的限制。并且这也将有望为开发更自主、自适应的 AI 模型提供方向,比如在复杂决策(医疗诊断、算法设计)中动态调整策略。

日前,有 Meta 员工在美国匿名职场社区 TeamBlind 发帖表示,因 DeepSeek 旗下模型性能优异且训练成本极低,导致 Meta 的工程师正在疯狂分析 DeepSeek,并试图从中复制一部分内容。在早些时候,博主 scaling01 对比分析,DeepSeek 不仅性能上赶超,参数量达 671B 的 DeepSeek-V3 训练成本也仅为 558 万美元。相较下,Meta 的 Llama3 系列模型的计算成本足够训练 DeepSeek-V3 至少 15 次。

此外,1 月 26 日下午,DeepSeek App 因用户访问量激增而短暂出现服务器繁忙的状况,甚至一度出现崩溃情况。

0 阅读:0
阎象谈娱乐

阎象谈娱乐

感谢大家的关注