对话百度侯震宇:大模型落地,走到哪儿了?

树龙谈 2024-01-08 15:58:39

2023年被称为“大模型元年”,中国涌现出200多个大模型,掀起“百模大战”。行业很热闹,创业者很兴奋,但大模型具体怎么落地,很多人摸不着头脑。

如果按下场的时间顺序,百度是中国互联网大厂中最早的。它在3月16日发布文心一言,直接对标ChatGPT,同步开启内测。在那之后,阿里、华为等公司的产品纷纷面世。

百度的技术落地同样很早。5月9日发布的百度智能云千帆,是百度面向企业客户的大模型平台,提供大模型推理服务和模型精调开发全套工具链,它帮助企业加速将大模型的能力应用到具体的场景中。

落地非常重要,因为大模型本身不产生价值,它是各类AI原生应用的基础底座,只有跟具体业务结合,价值才能得以体现。

行业里对大模型的认知,尤其在落地方向上的理解,一直在加强。按照百度集团副总裁侯震宇的说法:“从拥抱大模型,到评测大模型,到研究如何使用大模型,再到现在基于大模型设计自己的应用架构,更好在实际业务中发挥大模型的能力,这是过去一年比较明显的变化。”

侯震宇是百度老将,曾参与百度早期大规模存储和计算系统的设计,推动了百度统一的基础体系平台建设,2019年带领团队保障春晚红包活动顺畅进行。他现在负责百度智能云事业群组云计算产研团队和基础技术工程团队。

侯震宇 来源 / 公开资料

百度智能云是百度的大模型技术在B端落地的一个抓手,侯震宇在过去一年里接触了大量对大模型感兴趣的企业,推动百度智能云To B业务的发展落地。

最近我跟侯震宇进行了一次一对一深聊,就大模型的产业落地、商业模式,以及“百模大战”的是与非,他提出了自己的见解和观点。

“从评测大模型,到基于大模型做应用”

问:今年5月的时候,你说文心一言发布后两个多月,企业的反响变化很大,一开始都是CEO来交流,后来变成了业务负责人。现在又半年过去了,企业对大模型的态度有哪些新的变化?

侯震宇:5月份整个产业界对大模型的态度不是很明朗,6、7月份的时候企业主要关注大模型的水平,用评测的方式看哪个能力强,现在企业更关注AI原生应用,有一批真正想用大模型的人不是自己去做大模型,而是基于大模型更好地去使用AI的能力。

从拥抱大模型,到评测大模型,到研究如何使用大模型,再到现在基于大模型设计自己的应用架构,更好发挥大模型的能力,这是过去一年比较明显的变化。

问:哪些行业、类型的客户,业务能跟大模型更好地结合、落地?

侯震宇:我们现在说的大模型主要还是大语言模型,落地首先从能力侧去驱动,比如文案生成类,包括生成文字、PPT、营销文案等等;其次是对话交互类,比如客服、评判,这在教育行业应用非常多。从行业来看,金融、教育、电商、互联网等数字化基础比较好、预算相对充足的行业更容易落地。

问:企业目前对于大模型的理解,处于什么样的水平?

侯震宇:有高有低,更多取决于企业原本的水平。我们发现一些有互联网背景的企业,比如手机厂商、造车新势力,接触、理解大模型很快。还有一些传统车企、金融领域的企业,拥抱大模型的决心很大。一些国企央企有预算,但决策链条相对长一些。

问:“千帆大模型平台”上线半年,现在进展怎么样?被用到最多的服务或功能是什么?

侯震宇:从产品角度来看,千帆是百度这几年少有的从零开始做、成长最快、功能最多的云上产品。它的定位是帮助企业打造自己的模型,同时提供文心一言和其他开源模型的调用托管。

我们看到,不管百度外部企业还是百度内部,基于文心一言做SFT(有监督微调)的场景越来越多。千帆除了可以调用文心一言的托管,还可以提供一整套工具链,它其实是面向整个模型生产的全生命周期平台。8月31日文心一言在国内率先通过大模型备案后,在千帆平台上跑大模型的客户成指数级的增长,而且大家从玩、测试到真实使用,趋势很明显。

问:有没有那种客户感兴趣,但是实际应用起来比较困难的行业或案例?

侯震宇:目前,有一些要求100%准确率的场景,应用起来会比较难。因为大模型现在是基于生成式的,不像搜索一样绝对精准。它是一个工具,不负责产生100%准确的权威数据,所以有些场景即便达到95%的准确率,可能也不能满足客户的需求。

问:ToB行业竞争激烈,需求多样,你们更愿意跟什么规模的客户在落地上做更多的探索合作?

侯震宇:我们不太挑客户,作为国内最早做出大模型的厂商,同时有云底座,我们本身是行业的先行者,有义务去教育市场。

ToB确实比较卷,比较定制化,但有了大模型其实好很多。不用再像过去AI四小龙那样,所有场景都要拿着大量数据从头训一遍、调优。生成式的预训练大模型已经带来巨大飞跃,现在基于预训练的基础大模型做剩下部分的工作相对容易、标准化很多,而且技术门槛、交付成本也降低了。

“大模型将改变云计算格局”

问:从商业转换或者变现角度,大模型对云的推动或者作用提升到底有多大?

侯震宇:我觉得大模型和生成式AI,终将改变整个云计算的格局。从今年英伟达的火爆程度就可以看到,变化已经发生了。

目前国外、国内最大的云平台分别是AWS、阿里云,它们都是基于互联网和移动互联网崛起,跑在以应用逻辑为主的CPU上,所以过去芯片领域的老大是英特尔和高通,但现在不论是市值还是销售额,上个季度英伟达已经反超英特尔和高通。

再过几年, GPU的增长一定远远大于CPU。接下来,大模型不一定只是API调用按Token计费的模式。虽然现在很多企业仍然是裸买算力,但是大模型的技术门槛很高,很多企业没必要从头开始训练自己的基础大模型,更多会基于千帆平台或某个成熟的大模型做二次开发,很多环节都会依赖GPU。而除了底层资源,MaaS服务的比例会越来越高,这会是接下来1到3年的趋势。

另外,大模型还带来了AI研发范式的重构。企业不需要从头开始训练模型,而是去选择一个好用的通用大模型,结合自己场景的少量数据去做SFT有监督精调,就可以获得很好的应用效果。所用的数据量、算力规模、所训练模型的时间都大大缩短了,而且效果更好,迭代的速度更快。这是一个新的AI研发范式,它会节省更多的算力和人力资源,大幅提升研发效率。

问:今年大家都讲MaaS,你觉得什么时候MaaS能够成为比较成熟的商业模式,带来比较大的收入占比?

侯震宇:随着使用模型的程度加深,MaaS服务会逐步往上走,最终会有大量的AI原生应用出现,就跟移动互联网的APP一样。这其中每一个应用都会有自己的小模型,但是这些模型不一定是从头开始训的。

MaaS的收入至少分两类,第一是面向模型的研发收入,包括基于基础大模型做SFT、Post-pretrain,这会逐步取代裸用算力做模型训练部分的收益;第二是推理收入,模型训练的价值是为了能够用到业务中去做推理,推理才是真正的业务,未来会成为MaaS收入的大头。

问:各家云厂商都会推自己的MaaS服务,你们日常跟客户接触的时候,怎么建议人家选择百度智能云?客户在意的点跟你们能力的特长是否匹配?

侯震宇:百度是底层算力、MaaS及应用开发工具端到端都在做,千帆平台除了有文心一言,还有其他50多个模型,以及底层百舸的算力。传统的云厂商虽然也都说做MaaS,但本质上还是卖云的模式,以卖GPU算力为主。

在传统的云市场,我们有百舸,而在文心一言所在的领域,目前遇到比较多的是智谱AI、MiniMax这些创业公司,他们没有云,更多是做一些方案。这两类竞争对手彼此遇不到,而百度在两方面都有布局,这意味着,在百度智能云上用大模型,能从底层算力到上层应用端到端打通,从而实现更好的迭代。

问:8月31日,文心一言开放全民使用,一天之内APP的用户数就突破百万。在那之前你们是否有做预案,为之预留足够的算力资源?

侯震宇:我们当时准备的资源还是挺多的,但当时还是爆了,用户数远超我们预期。好在当时没有宕机,但内部也挺紧张的,有点像2019年做春晚红包。

问:过程中压力主要来自哪方面?

侯震宇:量太大,当时没有想到大家热情那么高。

问:这几个月文心一言的增长如何?

侯震宇:涨的很快,8月31日开放注册那几天是峰值,后来逐步平稳一些,呈稳定增长的趋势。可喜的一点是现在不只是文心一言的调用在增长,客户对云的调用量也上来了。

问:所以现在相对比较平稳了?

侯震宇:现在还在持续涨。To C的文心一言APP是先从峰值下来一些,然后逐步上涨,关键是ToB业务也起来了,调用量一直在涨,我们需要不停往上扩资源。

问:5月的时候你说文心一言大模型推理成本降为3月的十分之一,现在推理成本降到了多少?

侯震宇:我们从3月份发布文心一言到现在,基本上把推理的成本降到了原来的1%。

问:成本下降是怎么推动的?未来的下降空间还有多少?

侯震宇:成本下降的趋势很明显。某种程度上这也是因为技术进步很快。今年三四月份行业对大模型技术的探讨更多是在论文层面,五六月份有很多基于推理技术的优化,最近出现很多基于应用层面的技术使用,整个行业的技术都在持续向前推进。

问:这对于大模型未来的应用是比较好的消息?

侯震宇:是好消息。AI原生应用能不能起来,成本是一个很关键的因素。推理成本直接决定了企业能否用得起,现在我们在做大幅度的成本优化,否则确实很贵。

“明年行业洗牌,大模型会死掉一批”

问:上半年“百模大战”刚开打时,很多模型厂商都说要训练自己的大模型,最后实际真正动手训练的你觉得有多少?现在还在训练的多吗?

侯震宇:200多个大模型,绝大多数是凑热闹,因为短时间不一定能找到算力资源,首先自己买英伟达的卡很难,有卡的云厂商也挑客户;其次训练一个大模型不只需要算力资源,还需要高质量数据。所以很多企业都是拿开源模型改一改,另外还有一些是调用别家的基础模型做二次开发。真正在做大模型的也就几个大厂,以及头部的几个明星创业公司。

问:半年前还有不少公司称要做中国的OpenAI,但现在没有多少人提这个目标了,为什么?

侯震宇:其实现在国内的一些大模型,比如文心一言,跟GPT3.5相比已经不弱了,甚至在某些方面还要领先,即便对比GPT4,我觉得也至少不是全面落后,应该是互有胜负,有好有坏。至少从现在已经发布的模型来看,我觉得差距在缩小。关键是是否过了可以应用的门槛,我觉得过了GPT3.5的水平,就相当于过了基本可用的门槛,剩下的更多是如何落地应用。模型做得再好,不应用就没有意义。

问:OpenAI开发者大会发布GPTs,现在访问量前70%都是OpenAI官方自己的GPTs,百度是否会像OpenAI一样,推官方的应用,让大家更快把这个东西用起来?

侯震宇:我们也在做类似的事情,但我们相对比较谨慎,有取有舍。首先除了百度智能云在做ToB业务,百度移动生态也在做ToC业务。除了文心一言APP,百度搜索、文库、网盘等To C业务也在用文心一言的大模型能力做重构。

智能云这边,我们一直在做基于大模型能力的增强迭代,做很多应用组件。这些能力可以帮助客户管理Prompt(指令),比直接裸调文心一言更方便。

问:不久前谷歌发布了Gemini,争议比较多,你怎么看?

侯震宇:我认为多模态终将是大趋势,因为移动互联网某种层面上是多媒体内容的交互方式和消费内容,传统PC互联网才是文字,而现在大语言模型也才刚刚开始,所以多模态在明年会逐步发展起来。谷歌做的确实是前沿方向,但是它以什么形式应用,还有待观察。

问:今年有两家很火的创业公司,一个是Midjourney,一个是Pika,前者只有11个人,后者只有4个人。这是否说明大模型的技术门槛其实没那么高?创业公司反而更有优势?

侯震宇:确实有很多创业公司做创新可能比大公司要早,因为大公司追求的更多,某种程度上,像百度这样的大公司不会只追求做一个Midjourney。创业公司不像大公司有明确的ROI、财报压力,可以探索更多可能性,但大公司的整体实力更强。如果是追求通用大模型,那创业公司需要拿出硬实力,如果是做应用,在一些垂直领域创业公司还是有机会。

问:创业公司的机会可能会在哪里?

侯震宇:大模型概念在今年太乱了,什么人都说在做大模型。在某种特定领域用Transformer做自迭代的AI,确实可以做出不错的效果,这些领域大公司未必看得到,创业公司跑得快。关键是创业公司能否在特定领域建立壁垒,否则基础大模型会用更加通用的方式扫荡一切。就像去年很火的Jasper,它的能力建立在OpenAI的通用能力之上,OpenAI迈一小步就把它推翻了。

问:百模大战200多个,明年活跃的会剩下多少个?

侯震宇:我觉得现在也没几个真正活跃的。反正我们去见客户时,经常能碰到的也就那么几家。因为GPU限制,明年一定会死掉一批,即便有钱也搞不定。明年行业洗牌,2025年不会剩下太多,因为市场不需要这么多,这种情况下还去卷基础大模型是没有意义的。只有模型的效果好,产品好,才有可能活下来。另外也可能会有一些开源模型崛起,逐步变成大家长期使用的一个网络结构,降低行业的门槛。

作者/贺树龙

编辑 / 黎明

1 阅读:20