说到底，也是被美国的制裁给逼得。因为在同样的架构下，国内的训练速度与国外本来就

说到底，也是被美国的制裁给逼得。因为在同样的架构下，国内的训练速度与国外本来就有代差，再加上芯片被制裁，算力跟不上，差距只会越拉越大，无奈之下，幻方团队决定从架构入手缩小硬件和投入的差距，实现了轻量化的结构创新，结果一鸣惊人。梁文峰自己也都非常意外，他没想到把价格打下来之后，直接掀起了全行业跑马圈地的价格战。先是国内，清华大学的智普AI在deepseek v3横空出世五天后就果断跟进降价了，然后是字节、阿里、百度、腾讯等大厂的大模型接连降价，很多都是烧钱补贴，因为整个AI行业的竞争态势已经变了。国内大厂如此，国外OPENAI降价也就是迟早的事情了，关键是美国人的成本更高，投入更大，估值更高，关键是不想降价也得降，因为deepseek的代码数据都已经公开，无数本来没有足够资金的中小公司会纷纷加入战场，把砸了几千亿上万亿的大厂们拖入了降本降价的价格战漩涡中。接下来，会发生什么事情呢？没有人敢肯定，但有一个前提已经确定了。那就是马斯克在1月13日说，现实世界能用来训练AI模型的数据资料，已经在2024年消耗的差不多了。很多大模型训练都是相互借鉴数据。ChatGPT5.0迟迟出不来可能也就是这个原因，那种全知全能的AI暂时就先别想了，大家手里AI大模型的水平可能拉不开太大差距，拼的是谁能更快找到应用场景以及谁能把价格打下来。这个时候，幻方给大模型底层架构的算法创新带来了软件基础，前几天英伟达发布的3000美元家用迷你AI超算又提供了硬件基础，开发大模型的成本投入大大降低，各行各业，各个公司甚至很多个人都会开发出适合自己的AI应用。就好像无数程序员八仙过海纷纷开发APP和小程序，整个AI生态会在未来某个时候迎来超级爆发，创造过去二十年互联网产业一样的繁荣。最终就会有AI＋电商、AI＋教育、AI+医疗等等，就好像移动互联网的普及，得益于更低的成本和更好的基建，同样的技术普惠条件下，AI领域，中国也更有可能率先爆发出超级应用。更何况，中国每年工科毕业生超全球总数1/3，已经储备了超过600万理工科研人才，搞不好从哪冒出一群批人就把老外给超了。连梁文锋本人都曾自豪的说，他们没有海外回来的人，他们也没有世界前50名的顶尖人才，但是他认为他们也许能自己打造这样的人。可见这群新技术极客身上，不再妄自菲薄。无论如何，扎克伯格有一点没说错，接下来依旧是中美两强的战争，只不过决定胜负的时间点谁也说不好，唯一可以肯定的是，前期投入大量人力物力财力的公司无论中美，肯定会死掉一大批，一次重大泡沫危机也必不可免，甚至倒掉上一个时代的巨头，然后给新的AI巨头提供空间和养料。总之，新架构的横空出世、训练数据的提前枯竭以及个人AI超算的到来，三个领域，两个国家，几个大佬不约而同的共识，不是巧合，显然已经勾勒出了未来的大致轮廓。

0 阅读：611

说到底，也是被美国的制裁给逼得。 因为在同样的架构下，国内的训练速度与国外本来就

说到底，也是被美国的制裁给逼得。因为在同样的架构下，国内的训练速度与国外本来就