尽管DeepSeek R1的发布导致英伟达的股价周一暴跌了17%,英伟达的发言人还是对DeepSeek进行了正面评价:“DeepSeek是一项出色的AI进步,也是测试时间缩放的完美示例。DeepSeek的工作说明了如何使用该技术、利用广泛可用的模型和完全符合出口管制要求的算力创建新模型。” 英伟达的发言人认为DeepSeek的突破为英伟达的GPU创造了更多机会,因为推理需要大量的英伟达GPU和高性能网络,而目前存在3条缩放定律:训练前定律、训练后定律以及新的测试时间缩放定律。 英伟达的发言人还表示,DeepSeek使用的英伟达GPU完全符合出口标准。这与Scale AI首席执行官亚历山大·王的评论相悖,他认为DeepSeek使用了禁止出口给中国大陆的英伟达GPU。而DeepSeek表示,它使用了专供中国市场的特殊版本的英伟达GPU。 英伟达的评论还反映了英伟达首席执行官黄仁勋、OpenAI首席执行官山姆·阿尔特曼和Microsoft首席执行官萨蒂亚·纳德拉最近几个月讨论的一个新主题。 AI的繁荣和对英伟达GPU的需求在很大程度上是由“缩放定律”推动的。这是OpenAI研究人员在2020年提出的一个AI开发概念。这个概念表明,可以通过大幅增加构建新模型的算力和数据量来开发更好的AI系统,因此需要越来越多的芯片。 自去年11月以来,黄仁勋和阿尔特曼一直在关注缩放定律的新变化。黄仁勋称之为“测试时间缩放”。这个新定律表明,如果经过充分训练的AI模型在进行预测或生成文本或图像时花费更多时间使用额外的算力以允许其进行推理,那么它将比运行时间更短时提供更好的答案。 OpenAI的一些模型(比如o1)以及DeepSeek突破性的R1模型都运用了测试时间缩放定律。
尽管DeepSeekR1的发布导致英伟达的股价周一暴跌了17%,英伟达的发言人
天天岸边听潮
2025-02-01 18:26:07
0
阅读:58