起底DeepSeek爆火背后的推手 DeepSeek出圈让美国唯算力论崩溃 关于DeepSeek以及美国AI未来的趋势,马斯克认为最有道理的一篇分析,总结如下:DeepSeek 600万美元的训练成本并不包括之前的架构设计、算法实验和数据准备。这意味着如果没有数亿美元的前期投入以及强大的硬件集群,复制DeepSeek的成功几乎不可能。
DeepSeek的成功,部分依赖于对现有模型的“蒸馏”。这说明美国对高端芯片的出口限制,并没有完全阻止其他国家获得先进AI模型的能力。就像马斯克说的:“何必花钱买奶牛(GPU),直接喝牛奶(蒸馏模型)就行?”
未来的AI发展趋势,几个关键点值得关注。首先,AI推理将从云端转向本地设备,这会推动PC和手机等终端设备的升级换代,也可能冲击现有的AI基础设施巨头。其次,超级智能的出现,一旦实现,将带来巨大的经济效益,但同时也会带来巨大的能源消耗。再次,那些拥有海量数据和高效分发能力的平台,例如YouTube和Facebook,将在AI时代获得更大的优势。最后,美国实验室可能会选择不再公开最先进的AI模型,以防被“蒸馏”,但这招可能已经晚了。
关于Grok-3,它将是对大型语言模型“预训练扩展法则”的一次重大考验。据说,Grok-3的能力已经超越了某些现有模型,未来几周内,通过强化学习,它的推理能力还可能进一步提升。Grok-3到底能强到什么程度,现在还不好说。