国产AI大模型弯道超车,算力芯片成本下降11倍,雷军千万年薪挖角

肥鱼商业 2024-12-31 22:05:11
超强国产AI大模型发布

就在2024年12月26日,由“幻方量化”的子公司“深度求索(deepseek)”发布了最新的ai大模型deepseek v3。该大模型一发布就在全球AI圈投下了一颗重磅炸弹,甚至一定程度上影响了美国股市的科技公司。

技术细节这里不做叙述了,不然估计都会看的昏昏入睡。这个国产AI大模型最厉害的地方,就是把AI训练成本优化到了当前的1/11,直接把AI训练变成了“白菜价”。

deepseek v3大模型在测试中,跟现有全球主流的AI大模型不相上下,部分领域甚至表现的更好,在数字、中文、代码方面,更是直接击败了GPT-4o,并且还大幅领先。

也就是说,马斯克花了100亿美金买的英伟达AI芯片,现在可能只需要10亿美金就能搞定了。而且只用花600万美元,就可以达到跟现在GPT-4o同样的自然语言问答效果了。

由于对算力需求的下降,算力芯片的成本也就更低了,而这对于在AI金矿中卖“铲子”的公司并不是一件好事,比如英伟达。

deepseek拉近了中美技术差距

deepseek v3发布后就完全开源了,国外很多人都下载源码并且进行了测试,获得的评价也是一致的高,很多评论都说该大模型有些惊人的表现。

甚至连AI界的大神们,像openai的研究科学家卡帕西,阿里巴巴技术副总裁贾杨清,都盛赞了该大模型。

谷歌前CEO曾经说中国在AI领域落后美国三年,但是在前段时间看到这款国产AI大模型后,说自己错估了差距,中国只差美国一年时间,甚至更少。

在美国对中国进行芯片制裁的关键时候出现了这款大模型,直接让芯片成本大大降低,让芯片制裁的影响力缩小,并且快速缩短了中美之间的差距。

deepseek v3大模型是基于GPT4的核心算法进行的优化,也算是站在了巨人的肩膀上。但是以前的ai大模型每一代的算法优化,对算力的要求都会不断增长,但是deepseek v3却让算力实现了下降,成功完成了弯道超车。

小米千万年薪挖95后AI天才少女

deepseek模型的主要贡献者之一,95后AI天才少女罗福莉也成了当前炙手可热的人才。雷军更是亲自下场挖人,开出了千万年薪,邀请罗福莉带领小米的AI团队。

罗福莉硕士毕业于北大计算机语言专业,在自然语言顶级会议上发表了8篇论文。毕业后加入了阿里达摩院,主导开发了VECO。2022年加入了deepseek,参与了deepseek大模型的开发。

这里也不得不说一下雷军做事真会挑时机,其他公司都在花重金购买算力芯片的时候,小米一直按兵不动,直到现在deepseek v3把成本打下来后,就开始发力AI,而且非常精准的直接挖背后推手,真是花小钱办大事。

可能有人对deepseek开源有疑问,其实开不开源都不重要,因为具体到AI公司,还需要喂养大量数据,这才是一个更大的门槛。

deepseek v3几乎凭借一己之力,把中国和美国的AI技术拉到了同一个起跑线上。这两年,也注定是中国技术集中大爆发的时候。

0 阅读:0