刚刚过去的2023年,被称为中国大模型的“元年”
文心一言、通义千问、讯飞星火、紫东太初……一年当中,AI大模型如雨后春笋般层出不穷。“百模大战”让大模型走上了市场“风口”,2024年,Sora横空出世,作为一个数据驱动的物理引擎、视频生成领域的大模型,Sora创造了几乎可以乱真的数字世界,又给整个行业带来了无比的震撼,同时也带来了疑问:为什么大模型越来越多,但智能产业并未看见拐点?
今年的政府工作报告中,加快发展“新质生产力”被列为2024年的首项政府工作任务。“新质生产力”的核心,是以科技创新驱动生产力向新的质态跃升,做到“以新提质”。
很明显,大模型技术可以成为“求新”的抓手,但却不代表有“质优”的结果。而发展“新质生产力”不仅仅是生产力,还要形成与之相应的新型生产关系。所以,大模型技术能不能成为新质生产力,最终还是要看大模型在行业落地的成果。
换言之,大模型技术要与垂直领域的场景和需求相结合,创造出符合行业应用特征的垂域大模型,并延伸到千行百业,才有机会让智能产业迈进拐点,以垂域大模型为帆,驶向新蓝海。
大模型要成为普惠技术与场景结合至关重要早在2016年,《智能时代:大数据与智能革命重新定义未来》就预言:传统的行业都将采用智能技术实现升级换代,也会改变原有的商业模式。
今天的智能化技术与产业的融合也的确变得越来越紧密,从智慧医疗,智慧金融,智慧城市再到无人驾驶,智能化正在改变千行百业的方方面面。
浪潮集团副总裁、浪潮通用软件有限公司总经理魏代森也表示,“人工智能应用越来越普及,从嵌入式智能到原生智能,赋能业务流程自动化,AI框架将成为软件的基础架构,使得智能化场景越来越丰富,同时对工作和生产效率也产生了巨大的提升。”
这种行业智能化的速度,随着大模型技术的火热,明显得到了加快。
麦肯锡的报告预测:到2040年,生成式AI每年可为全球经济带来2.6万亿至4.4万亿美元的增长;IDC也预测:到 2024 年全球将涌现出超过 5 亿个新应用,这相当于过去 40 年间出现的应用数总和。
大模型市场背后的市场潜力是如此之大,但市场的机会是否属于每一家大模型技术的提供商呢?答案显然不会是肯定的。
我们应该看到,通用大模型的迭代速度飞快,从去年3月到11月,仅仅用了3个季度的时间,GPT-4就快速升级到GPT-4 Turbo,更长的上下文、更强的控制、知识升级、多模态、模型微调和更高的速率限制……能力提升的速度让整个业界为之震动。
这意味着,如果国内的通用大模型,仍旧保持传统的创新模式,要追上GPT的创新步伐是非常不现实的。
但从行业的角度看,任何技术本身都是不具备行业属性的,脱离了场景的技术也无法称之为有用的技术。这又代表着,大模型技术可以通过融入场景来展现它的价值。
这其实不仅是垂域大模型的生存空间,更是发展机遇。大模型的能力需要行业场景反馈的数据支撑,大模型应用的行业场景越广泛,垂域大模型的发展空间就会越明显。
如魏代森所说,“去年开始大模型越来越热,同时对企业应用的作用也逐步加深,这意味着垂域大模型的场景会越来越丰富,能力也会越来越强。”所以去年9月发布的浪潮海岳大模型inGPT,就直接定位于企业服务垂域大模型,作为与行业场景深度融合的大模型,开启了大模型加速行业落地的先河。
如何跨越大模型在行业落地的“最后一公里”?有人把大模型比喻成蒸汽时代的发动机、电力时代的电动机,的确通用大模型可以扮演“引擎”的角色,具备重塑很多行业运行规则的能力。
无论“引擎”的创新多么具有革命性,行业客户其实希望看到的还是技术的普惠,是可以做到星火燎原的技术。要点燃这把“星星之火”,就要跨越大模型技术与行业客户的AI应用落地之间的那段很长的距离。
这正是垂域大模型诞生的使命和责任。
浪潮通用软件有限公司副总经理、首席技术官郑伟波说,“海岳大模型自去年的发布1.0版本之后,面向很多垂直领域做了落地,这个过程中我们发现大模型在企业落地的挑战,其中包括成本、数据、生态、适用性、安全等问题。”
确如此言,比如在成本方面,大模型训练和部署成本一直居高不下,意味着千亿级大模型在企业中的应用面临巨大的投入,这是企业应用大模型不可承受之重,大模型的投入产出比,未来将是大模型能否深入行业一个核心的话题。
而在数据方面,事实证明越是精准的数据输出的模型效能越显著,因此如何将企业原本分散的数据集中、梳理、清洗为高质量数据,对于大模型在行业的应用上将会事半功倍。
适用性则是“垂域”这个“垂”字的关键,利用大模型的能力做出符合企业需求的应用,核心要看企业的“知识”。对特定行业的深入理解,找到真场景,形成有价值的行业、领域知识,会加速大模型在行业场景中的落地。
生态的意义就毋庸置疑,企业的应用环境本身就非常复杂,多个厂商的软件和大模型要相互融合,开放协作的生态系统必不可少;而数据安全是一个老生常谈的话题,无论任何技术创新,都离不开数据安全的保证,当然大模型的研发和应用过程中,也的确存在数据泄露的风险,无论是公共大模型还是私有部署的大模型,都要谨守数据安全关。
“海岳大模型内置六大原子能力,接入之后可以真正在企业落地应用大模型。通过数据,知识管理平台解决异构、分散数据难治理,隐性知识难挖掘等难题。通过生态,打造企业专属大模型技能生态、插件生态,并确保数据安全。”郑伟波说
同时郑伟波也表示,“垂域大模型就是企业落地的最佳途径。通用大模型很难解决企业内的应用场景,而垂域大模型,通过精调训练,融入到大模型里,形成客户私有的大模型,才能真正落地,所以说垂域大模型是支撑大模型在企业落地的非常重要的方式。”
垂域大模型何以成为大模型落地行业的最佳抓手客观地说,大模型的行业落地,要与垂直领域的场景相结合,不仅要求基础模型的综合能力,还要降低客户进入大模型的门槛,并兼顾到一些具体行业应用,打造出最佳实践,以做到缩短大模型落地行业的周期。
也就是说,要实现向企业提供服务领域的垂域大模型,需要有一整套从技术底座,到模型,再到智能体的完整方法论。
这也是浪潮通软将海岳大模型分为三个层次的原因。
底层是工具“基座”层,包含了数据训练、接入框架、知识管理框架、模型组装工具和调优、部署工具等,形成了公共技术基座。“一个通用大模型怎么把垂域大模型的知识融合进去,怎么把企业的知识融合进去,需要知识管理的工具,需要微调训练的工具,需要部署的工具,所有这一切都需要由基座来支撑。”郑伟波说。
而模型层,也就是垂域大模型,相当于整个体系的“大脑”,它可以提供核心的认知推理能力的,与应用结合后,形成具体行业应用的智能体,而智能体一方面对接了大模型的能力,理解推理能力,另一方面和应用结合形成可以在行业场景中落地的智慧应用。
郑伟波表示,“我们发布了智能体的架构,内置了很多智能体,和海岳软件融合,形成了一系列的插件库和数据库,以支撑行业的大模型应用。同时也布局了100多个智能体,进一步支撑企业在智能化场景的落地。”
从这个角度,浪潮通软不仅仅是一个大模型技术的服务商,更是行业智能化的解决方案提供商。浪潮海岳大模型作为垂域大模型的典型代表,能够迅速在众多行业和领域落地,主要有几个原因:
第一,知识的沉淀决定了数据基础。过去30年,浪潮通软积累了丰富的行业实践,例如在财务、人力、司库等业务领域,以及智能制造、粮食仓储、智慧水务、智慧矿山等垂域行业,沉淀了大量领域专有知识,形成了高质量的数据基础,这对于垂域大模型的精准度有较大提升。
第二,海岳大模型作为浪潮通软智能化服务的一部分,它天然具备客户视角,和很多业界的大模型仅能提供基础技术能力不同,海岳其实是垂域大模型+智能体的一体化解决方案,客户拿到的不只是大模型本身,而是一套建立在大模型技术逻辑上,可以开箱即用的智能化解决方案。
第三,大模型的未来之争,不单纯是模型技术之争和部署能力之争,而是生态体系之争。而浪潮通软的软件基因天然就具备生态属性,不仅要兼容并包,还会跨行业、跨场景提供解决方案,所以浪潮通软的生态意识,在未来也会成为海岳大模型的一个重量级砝码。
可以预见,大模型的发展曲线还远未到顶点,但大模型技术作为产业智能化的支撑点之一,我们更希望在到达顶峰之后,能够留给市场更多的长尾效应,这样的故事线,才是我们最希望看到的结果。