ChatGPT在2023年引发的大模型热潮还尚未退去,2024年Sora的横空出世,又给整个行业带来了无比的震撼,也让我们充满了无限畅想,AI和大模型到底能够给未来世界描绘出何种颜色?
无处不在的AI应用,无人驾驶的智能汽车,身临其境般的元宇宙数字生活,这些只有电影里才能出现的智能世界,已然近在眼前。
但实际上,面对市场上名目繁多的大模型,企业用户的选择却十分有限。
纵观市场上的上百家大模型,其实只集中在两个方向:一是基础大模型,二是面向垂直应用的行业大模型。前者要落地行业,仍然需要定制开发,后者只能解决单一场景的AI应用,本质上更像是小模型。
大模型距离行业落地之间的距离到底有多远?基于这样的思考,新华三集团近日发布了端到端的灵犀智算解决方案,以此满足千姿百态的行业场景与大模型技术融合落地的需求,这又会带来哪些启示?
01
如何缩短大模型落地行业的周期?
麦肯锡的报告预测:到2040年,生成式AI每年可为全球经济带来2.6万亿至4.4万亿美元的增长。
今年1月3日,IDC 发布的《2024 AIGC应用层十大趋势白皮书》则显示:随着 AIGC 技术的发展,智能化应用将呈现爆发式增长,IDC也预测:到 2024 年全球将涌现出超过 5 亿个新应用,这相当于过去 40 年间出现的应用数总和。
这两份数据显示出大模型市场背后巨大的市场潜力。
与此同时,大模型技术的迭代速度是如此之快,从去年3月到11月,仅仅用了3个季度的时间,GPT-4就快速升级到GPT-4 Turbo,更长的上下文、更强的控制、知识升级、多模态、模型微调和更高的速率限制……能力提升的速度让整个业界为之震动。
这意味着,如果国内的基础大模型,仍旧保持传统的创新模式,要追上GPT的创新步伐是很难的。
但从行业的角度,任何技术本身都是不具备行业属性的,脱离了场景的技术也无法称之为有用的技术。这又代表着,大模型技术也必须通过融入场景之中来展现它的价值。
当然,基础大模型和行业大模型,这两者之间又是相互促进,螺旋式上升的关系。基础大模型的能力需要行业场景反馈的数据支撑,行业大模型所需的能力,也要在基础大模型中得到满足。
所以,大模型与行业的结合,既要求基础模型的综合能力,也要降低客户进入大模型的门槛,并兼顾到一些具体行业应用,打造出最佳实践,以做到缩短大模型落地行业的周期。
这其实,也是新华三推出灵犀智算解决方案的初衷。
02
用“乐高”式方案组建大模型
如前文所述,一个强有力的AI基础设施技术能力,是大模型向百行百业延伸的基础。
在新华三坚持“AI in ALL”的背后,可以看出新华三自身面向AI时代的演进之路。
我们知道,早在2020年,新华三就发布“AI in ALL”技术战略,并以不断升级的数字大脑,助力百行百业走向智能化升级;在2021年,新华三又提出“云智原生”,将AI能力内蕴于产品之中,让智慧“内生”。这些战略的不断递进,让新华三无论从产品研发设计,到行业解决方案的打造,都注入了AI能力,这是新华三拥抱AIGC时代的勇气,也是提出AI for ALL的底气。
如今新华三已打造了一整套全面支持AIGC的云-网-安-算-存-端及运维能力在内的融合ICT产品与解决方案,这也能看出,新华三在这场AI热中,一直站稳根基,不断精耕自身的基础设施AI能力。
所谓知易行难,大模型时代基础设施层的创新尤为关键。大模型具有数千亿甚至上万亿参数规模,单个计算节点无法满足训练需求,训练过程耗时巨大,需要通过分布式训练框架充分整合可调动的算力资源进行分布式并行加速。
但问题是,目前可选的算力资源类型多样,不同厂商的智算芯片之间往往无法形成“合力”,极大地限制了对现有算力资源使用的充分性和调度的灵活性,因此亟需面向异构算力混合训练需求进行技术研究。
与此同时,智算异构混合并行训练存在一系列技术挑战。由于不同智算芯片存在计算架构、缓存资源、互联方式等诸多差异,各厂商硬件互不兼容,导致多种智算芯片难以协同工作。
新华三则秉持“算力×联接”的理念,以算力多元化、联接标准化,充分发挥算力和联接双基石的乘数效应。
但是技术能力要在行业场景中发挥业务价值,仅靠新华三一家公司的力量并不足够。这也是为什么新华三会再提出“1+N”大模型策略(即百业灵犀私域大模型+N个优选通用大模型和行业细分大模型)的原因。代表着新华三可为百行百业客户提供全套弹性扩展方案,更好满足行业场景化、个性化、专属化智能升级需求。
以“算力×联接”的基础设施能力集为底座,依托“1+N”大模型策略,不仅能够满足客户智能算力需求,也能满足各个行业客户大模型落地的定制化方案。
换言之,新华三提供了一整套“乐高”式的AIGC解决方案,用户可以根据自己的需求,去自由组成符合自身业务需求的大模型。
03
新华三,抛出了智慧的“火种”
当然,行业客户并不都具备较强的技术能力,甚至一些传统行业也没有完善的技术团队,要帮助这些企业实现向智能时代的转型,新华三还有很多的工作要做。
首先,是降低大模型落地行业的门槛。
新华三去年推出了私域大模型百业灵犀(LinSeer),和基础大模型不同,百业灵犀的私域大模型的语库是专为行业、区域专属定制的,因此它能够更为准确的把大模型的能力应用在相关领域。
在私域模型基础上,新华三基于百业灵犀进一步打造了灵犀应用使能平台(LinSeer Hub),通过一站式平台可实现多元模型组合管理、AI Agent开发、模型服务等功能,能够灵活兼容新华三百业灵犀私域大模型及现有国内外主流模型,帮助客户快捷构建智能应用,实现“模型使用自由”。
其次,大模型落地行业需要一批行业灯塔。
去年8月,新华三携手杭州市共建图灵小镇,围绕AIGC 打造“3+1”核心能力中心,共筑AI产业高地。半年后,图灵小镇AIGC智算中心正式启动,这与我们熟知的产业园区不同,图灵小镇聚焦于AIGC产业,可为入驻企业提供技术支持、资源共享、通用算力服务和创新合作平台,通过与产业生态的多维度务实合作,寻求新的增长空间和创新突破。
这是典型的通过生态赋能,帮助一个区域内的企业树立AIGC创新的航标。目前“图灵小镇”模式已在杭州、郑州、咸阳等多地落地,对当地产业智能化转型起到了积极的作用。
除此之外,新华三还与宁夏自治区人民政府携手打造了国内首个省区级数字政府大模型,并在宁夏等西部省份算力集聚和人力成本优势,开展大模型的“代训”服务,带动模型深调与精调、数据治理与标注等新产业、新业态落户西部,促进东西部优势融合。目前,新华三助力宁夏数字政府私域大模型搭建了AI算力底座、大模型基础平台和使能平台等,共同打造了政务服务智能助手和12345智能客服助手。
这些行业最佳实践的树立,显然对大模型的行业演进、发展和落地都能够起到重要的价值。大模型时代的到来,就像在黑暗的夜空中点亮了一支火把,它看起来似乎很近,但走过去却又很远,这把火要持续的燃烧,需要新华三这样的企业,以持续不断的技术创新和场景深耕,抛出智慧的“火种”,燃烧一整个时代。