国产AI大模型弯道超车，算力芯片成本下降11倍，雷军千万年薪挖角

超强国产AI大模型发布

就在2024年12月26日，由“幻方量化”的子公司“深度求索（deepseek）”发布了最新的ai大模型deepseek v3。该大模型一发布就在全球AI圈投下了一颗重磅炸弹，甚至一定程度上影响了美国股市的科技公司。

技术细节这里不做叙述了，不然估计都会看的昏昏入睡。这个国产AI大模型最厉害的地方，就是把AI训练成本优化到了当前的1/11，直接把AI训练变成了“白菜价”。

deepseek v3大模型在测试中，跟现有全球主流的AI大模型不相上下，部分领域甚至表现的更好，在数字、中文、代码方面，更是直接击败了GPT-4o，并且还大幅领先。

也就是说，马斯克花了100亿美金买的英伟达AI芯片，现在可能只需要10亿美金就能搞定了。而且只用花600万美元，就可以达到跟现在GPT-4o同样的自然语言问答效果了。

由于对算力需求的下降，算力芯片的成本也就更低了，而这对于在AI金矿中卖“铲子”的公司并不是一件好事，比如英伟达。

deepseek拉近了中美技术差距

deepseek v3发布后就完全开源了，国外很多人都下载源码并且进行了测试，获得的评价也是一致的高，很多评论都说该大模型有些惊人的表现。

甚至连AI界的大神们，像openai的研究科学家卡帕西，阿里巴巴技术副总裁贾杨清，都盛赞了该大模型。

谷歌前CEO曾经说中国在AI领域落后美国三年，但是在前段时间看到这款国产AI大模型后，说自己错估了差距，中国只差美国一年时间，甚至更少。

在美国对中国进行芯片制裁的关键时候出现了这款大模型，直接让芯片成本大大降低，让芯片制裁的影响力缩小，并且快速缩短了中美之间的差距。

deepseek v3大模型是基于GPT4的核心算法进行的优化，也算是站在了巨人的肩膀上。但是以前的ai大模型每一代的算法优化，对算力的要求都会不断增长，但是deepseek v3却让算力实现了下降，成功完成了弯道超车。

小米千万年薪挖95后AI天才少女

deepseek模型的主要贡献者之一，95后AI天才少女罗福莉也成了当前炙手可热的人才。雷军更是亲自下场挖人，开出了千万年薪，邀请罗福莉带领小米的AI团队。

罗福莉硕士毕业于北大计算机语言专业，在自然语言顶级会议上发表了8篇论文。毕业后加入了阿里达摩院，主导开发了VECO。2022年加入了deepseek，参与了deepseek大模型的开发。

这里也不得不说一下雷军做事真会挑时机，其他公司都在花重金购买算力芯片的时候，小米一直按兵不动，直到现在deepseek v3把成本打下来后，就开始发力AI，而且非常精准的直接挖背后推手，真是花小钱办大事。

可能有人对deepseek开源有疑问，其实开不开源都不重要，因为具体到AI公司，还需要喂养大量数据，这才是一个更大的门槛。

deepseek v3几乎凭借一己之力，把中国和美国的AI技术拉到了同一个起跑线上。这两年，也注定是中国技术集中大爆发的时候。

古典风资讯网