10月16日,李开复携零一万物的最新旗舰模型Yi-Lightning(直译为闪电模型)进行了线上发布,并接受了包括新京报贝壳财经在内的媒体采访,回答了包括“是否放弃预训练”、“定低价是否亏钱拉新”、“如何看待中美大模型差距”等问题。
李开复表示,在国际权威盲测榜单LMSYS上,Yi-Lightning超越了GPT-4o-2024-05-13、Claude3.5Sonnet,排名世界第六,中国第一。不过他也坦承,由于算力等直观差距,要缩短中美的大模型技术差距,难度很高。
辟谣“放弃预训练”国内大模型“六小虎”弹药充足
此前,零一万物曾在行业传闻中被指“放弃了预训练”。对此,李开复在发布会上用Yi-Lightning进行了“直接回应”,“Yi-Lightning在盲测模型擂台里达到了一万次以上的投票,最后结果是,排在我们之前的模型基本只有两个硅谷头部公司,就是OpenAI的几个模型,Google的两个模型,另外我们和马斯克的xAIGrok打平,并列第六名。从这里可以看到有关当前讲的大模型预训练中国不能做,这个事情我们正式辟谣。零一万物绝不放弃预训练,而且我们的预训练做得又快又好。”
李开复表示,做好预训练模型是一个技术活,而且要非常多有才华的人在一起工作,慢工出细活,“如果一个公司能有幸拥有这么多优秀的人才,能够跨领域的合作,那我相信中国是绝对可以做出世界排名前十的预训练的通用模型,但不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后有可能会越来越少的大模型公司训练做预训练。”
事实上,在AI最热的高光时刻逐渐过去,国内六家独立大模型初创公司(又被称为“六小虎”)均受到不同程度的质疑,有传言称其中已经有两家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用。
对此,李开复直言,据他所知这六家公司融资额度都是够的,“我们做预训练的productionrun(流水线生产),训练一次三四百万美元,这个钱也是头部公司都付得起,我觉得中国的六家大模型公司只要有够好的人才,想做预训练的决心,融资额跟芯片都不会是问题的。”
定价0.99元/百万token但没有“亏钱拉新”中美大模型差六个月已经是很好结果
本次,Yi-Lightning在盲测榜单LMSYS上排名第六,该榜单排名第一的是发布于9月3日的最新版本GPT-4o-latest,而OpenAI于5月13日发布的GPT-4o排名第七,在Yi-Lightning之后,这也让李开复感到骄傲,此前有说法称中美大模型的差距是六个月,而随着该榜单的出现,有声音认为这说明中美大模型的差距已经被零一万物拉近到了五个月。
对于能否继续拉进中美在大模型技术之间的差距,李开复坦言道缩短时间差非常困难,“我不预测我们可以缩短这个时间差。因为毕竟人家是用十万张GPU训练出来,我们用的是两千张GPU训练出来,我们能够达到这个时间差只是因为我们的模型、AIinfra(基础设施)等团队都热心聪明,去使用和理解对方做出来的东西,再加上我们自己每家的研发有特色,这一套方法论在零一万物已经成熟了,我们有信心把自己的创新加上一些特长,再关注OpenAI和其他公司发布的新技术,能够尽快地去了解这些技术的核心重要性,然后把它的能力在我们自己的产品里面发挥出来,我觉得这套方法保持在六个月左右,就已经是很好的结果了。如果期待破局,可能需要一个前所未有的算法才有机会。”
“我们千万不要认为落后六个月是一个很羞耻的事情,或者一定是要追赶的事情,因为我很多美国朋友都认为中国会远远落后,也有美国朋友包括一些中国朋友认为按照这个打法,基于算力的差距,我们要被甩掉三年、五年甚至十年都有可能,但现在从零一万物证明了不会落后这么多,而且这次LMSYS的榜单上也有两家其他中国公司表现也不错,也不是只有我们一家在做。所以对于奋力图强、勤奋努力、聪明多元化的团队,用类似零一万物的打法去贴近美国最顶尖的公司,不落后超过六个月,我觉得是可能,而且不只是我们一家可能,但难度是高的。”李开复说。
目前,零一万物将最新旗舰模型Yi-Lightning的API价格降至每百万token收费0.99元,直逼行业最低价。值得注意的是,此前国内大模型陷入“价格战”时,李开复曾对新京报贝壳财经等媒体表态,“零一万物不参与价格战。不能只看模型价格,还要看模型性能是否足够好。”
那么,为何本次李开复又主动降价了呢?对此,他表示在Yi-Lightning的定价上并没有亏本,“零一万物也在做App,我们知道做App需要控制成本,所以我们不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天0.99元/百万token的价格。”
新京报贝壳财经记者罗亦丹编辑陈莉校对柳宝庆