“新质生产力”和AI大模型是今年的两大关键热词。
“加快发展新质生产力”是2024年的政府工作报告中提出的首要任务。“新质生产力”的核心,是以科技创新驱动生产力向新的质态跃升,做到“以新提质”。
那么,AI大模型是否能够代表新质生产力?答案显然并不完全对。
要做到“以新提质”,求新是抓手,质优是结果。AI大模型技术可以成为“求新”的抓手,但却不代表有“质优”的结果。
发展“新质生产力”不仅仅是生产力,还要形成与之相应的新型生产关系。所以,AI大模型能不能成为新质生产力,最终还是要看大模型在行业落地的成果。
在4月17日举办的IPF 2024上,浪潮信息发布了大模型开发平台“元脑企智”EPAI(Enterprise Platform of AI),推动大模型与行业场景的深度结合,释放大模型技术的潜力,让大模型技术走出象牙塔,变成真正意义上的新质生产力。
大模型从风口到落地,还要过几道关从2023年的ChatGPT,到2024年的Sora,大模型技术正以不可思议的发展速度颠覆着我们的认知。过去一年,“百模大战”又让大模型站上了市场“风口”,通过更为泛化的能力,赋予了行业用户无限的想象空间。
麦肯锡的报告预测:到2040年,生成式AI每年可为全球经济带来2.6万亿至4.4万亿美元的增长,如此巨大的市场潜力,不仅来自于大模型技术的提供者,也会来自于千行百业的大模型技术应用者。
但风口上的大模型技术与行业客户的AI应用落地之间,却依然有很长的距离。
首先,巨大参数量级的通用大模型,很难直接用于复杂、离散的行业场景,各行业知识专业化程度高,可迁移性低,通用大模型本身难以覆盖,所以经常出现大模型“幻觉”或是“胡言乱语”的问题,这是企业大模型无法承受之重,因此必须结合行业专业数据进行再学习。
其次,要实现大模型与行业场景的深度结合,实现高效、高可靠、高质量的模型应用效果,涉及复杂的开发环节,技术门槛高且开发周期长,而且更难以回避的问题是:在大模型火爆的今天,高精尖技术人才和团队的搭建成本非常高。
第三,大模型应用开发是一个系统性的工作,仅就大模型本身,还需考虑大模型应用开发与多元算力、多元大模型的选择、适配、组合调度等问题,对于非科技类企业而言,无疑是增加了大模型落地的复杂性,这往往让企业对大模型开发望而却步。
正是为了迎接澎湃大模型需求,同时解决大模型开发的种种难题,企业大模型开发平台EPAI由此诞生。
EPAI的诞生符合大模型发展的时代主线以大模型为代表的生成式AI,正在成为AI时代的分水岭。
浪潮信息高级副总裁刘军说,“从产业来讲,生成式AI与上一个时代的AI最大的差别就在于场景。传统AI能够处理的场景很有限,过去5年,大概只覆盖了不到1%的AI场景需求,但生成式AI无疑打开了更多的场景空间。”企业的每一个岗位,每一个场景都值得用生成式AI来重做一遍,这是需求侧的巨大差别。
这也是为什么,浪潮信息会强调“大模型普惠”的原因。随着大模型技术的不断成熟和进步,焦点已经转移到AI技术与行业、场景的深度融合。这直接影响到大模型技术能力能否真正释放和赋能到千行百业,进而推动整个社会的生产力发展和效率提升。
“如果说2023年,让我们激动的是用户端的大模型应用,那么更多广阔的应用空间就在企业市场。未来,企业绝大多数的生产环节和业务环节,都可以与生成式AI做结合,并创造出新的生产力。”刘军说。
这就是EPAI “元脑企智”诞生的意义,它可以为企业AI大模型落地应用提供高效、易用、安全的端到端开发平台,提供数据准备、模型训练、知识检索、应用框架等系列工具,支持调度多元算力和多模算法,帮助企业高效开发部署生成式AI应用、打造智能生产力。
我们认为,EPAI的出现是符合大模型发展的时代主线的。
一方面,百模大战,通过算力密集、算法技能密集、人才密集形成了很好的生态。从企业的角度已经有了性能足够好的通用大模型可供选择,下一步一定会面对应用到场景落地,乃至产业化落地的问题。
另一方面,过去一年大模型在技术上取得了长足的进步。比如,数据的精准度更高,一些行业数据,和特定企业自身的数据,通过工具清洗出来,导入向量数据库,对原有的大模型形成了知识检索的增强;再有大模型在长下文方向上有了很好的突破,上百页的文档,大模型也可以做很好的处理,所以技术的发展,为企业大模型的发展做好了基础条件的支撑。
刘军也说,“以EPAI为例,通过打通行业知识,结合EPAI提供的方法论和工具,一位技术支持部的普通员工,可以仅用一个月时间,就能构建起一个大模型的应用。开发的门槛一下就降低了,这种普惠就是对开发者的普惠,企业不再需要高精尖的技术团队就可以去构建大模型,再去支持和服务好他们的客户。”
大模型的普惠,一直是浪潮信息的初心其实,面向大模型的行业普惠,这是一直是浪潮信息的初心。
早在2021年,浪潮信息就发布了源1.0大模型,它的目标是提供一片广阔的肥沃土壤,通过开放大模型API,服务于开发者,降低AI开发者和行业用户的使用门槛,以更通用的人工智能大模型赋能科研创新、公共服务智慧化升级和产业AI化应用。
去年底发布源2.0,成为了业内第一个千亿参数量级、全面开源的大模型,并且是完全免费、完全可商用、不需要授权、最彻底的开源。同时,浪潮信息还在开展千亿参数模型智能优化的工作,通过专门的性能优化团队,不断提升它在推理方面的性能,并持续让模型的资源开销和延迟都达到更好的效果。
所以说EPAI的发布,本质上是沿着降低大模型开发门槛,大模型普惠的路径上的一次再升华。
据了解,EPAI具备:自动化数据处理工具,生成微调数据和行业/企业知识库;实现百万Token、千亿参数、领域大模型的高效微调;本地检索专业知识库,以知识驱动提升大模型应用效果;提供三类使用方式,快速灵活完成开发;支持多元多模,适配快成本低;确保数据安全,提高隐私保护等一系列核心价值,通过端到端的解决方案,解决基础大模型落地到领域存在的幻觉问题,解决应用开发流程复杂、门槛高,以及多元多模适配难、成本高等落地难题。
当然,“浪潮信息会还是聚焦在基础模型层面,上层应用会留给元脑生态里面的各类合作伙伴,并通过伙伴去触达真正的行业应用,落地到具体行业应用。”刘军说。
在大模型为代表的人工智能发展,是算法、算力、数据综合发展的结果。浪潮信息能够通过EPAI赋能大模型开发,这背后也是浪潮信息在智算系统创新的综合价值。
在IPF 2024上,浪潮信息也提出一切计算皆AI的理念,并全面升级元脑品牌,从算力、算法、数据存储和互联四个方面全面布局,有了战略的支撑,EPAI也有了更多的应用场景和用武之地,将大模型打造成新质生产力,EPAI能够发挥越来越大的价值。