这是一位大佬StevenLH说的,我觉得意义很大,跟大家分享一下:首先,训练端离开天花板还远着呢。我之前帖子已经写了,美国从总统到业界也都已明了,AI在全球范围内需求和建设两个方面都会分多个层次。就如人各有志一样,有些人觉得发颗卫星已经很了不起了,此生足矣;也有些人对进一步研究没有兴趣,注意力都在弄应用尽快变现上,但更有好些人则非要登月不可。AI领域里登月的一个标志就是达到AGI-通用人类智慧,而载人登月则可能是Super AGI,就是比通用型人类智慧更胜一步。如果你志不在登月,当然现在就看到了天花板,但想登月的大有人在啊,那在训练端又怎么可能停下脚步呢?对这些人来说,训练端的天花板还远着呢。 训练段的天花板不是一个技术问题,是一个抱负问题。活着和活着可以说都是喘着气,一样的,但也可以说是很不一样的。 其次, 推理/应用端,很多人没搞明白的关键一点是,这个方面的the name of the game - 也就是竞争焦点从来都不是什么模型在什么样高级或简陋的硬件条件下能不能跑起来的问题,而是每单位能源成本每单位美元下每单位时间里能生成多少token和什么样质量的token的单位成本的问题。你现在弄出来个模型,软件效率不错,能在更低的硬件环境中跑了,这本身是好事,但必须要同时清楚,别人用牛逼得多的硬件加上你这个软件另外别忘了人家还有自己NB的软件(事实你的这个软件都是从别人那里蒸馏出来的,也就是相当于从别人桶里钓鱼,那钓得再快再巧,钓出来的鱼的总量也不可能超过别人,不是嘛),用于推理/应用端,那上述那个真正重要的单位成本问题一样远胜于你啊。况且,这个还只是做个单位成本的横向比较,这本身甚至都不是目的。推理/应用端的真正目的在于使用,不断得用,也就是不断地产生token,因为每一个token就是代表了人类的技能和智慧,可以直接用于提高生产力。既然全部目的是使用,那么一定是成本越低越好,因为越低就越会有更多人用;而用的人越多,对于算力的总体需求就越高,而这时又回到了前面的那一点,单位成本更低的算力竞争力显然也越高。AI单位成本的算力真正拉开差距的是GPU,软件再怎么优化也没办法和代际水平的硬件进步相媲美,何况软件可以非常容易的相互借鉴和学习,谁有好的模型,开源了,1-2天内全世界都集成了,然后耸耸肩,继续干啊。
我觉得达链没有问题,现在优质又估值低,我会坚定持有的。