而在deepseek-V2的时候,业内就已经非常重视这个团队了——通过MLA和MoE架构创新,Deepseek-V2将当时的token价格打到了行业平均水平的1/10甚至更低,也带动了一波行业价格战。 至于如今deepseek的真正爆火,我认为可以归因于两点: deepseek的模型能力真正达到了全球第一梯队,无论是传统预训练模型V3还是推理模型R1,都达到了全球头部水平,特别是R1,甚至在部分指标上超过了OpenAI的o1和o3模型; 第二点则是deepseek-R1出色的文笔带给用户的震撼,这一点从最近众多用户使用R1的反馈也可以看出,大大超出了普通人对AI的预期。 再加上众多KOL的推动(比如黑神话制作人冯骥),以及国产模型带来的民族情绪,deepseek有这样的热度自然不令人意外了。
而在deepseek-V2的时候,业内就已经非常重视这个团队了——通过MLA和M
晨晰聊房产经济
2025-02-18 10:48:31
0
阅读:44