模型规模并非越大越好?组合式AI加速领域大模型应用落地

新兴科技是个圈 2024-08-01 10:28:56

2018 年,预训练模型开始兴起,2022 年,ChatGPT 的火爆出圈让人们看到通过大规模预训练范式接近 AGI 的曙光。根据 2024 年政府工作报告,深化大数据、AI 等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。值得关注的是,这是 AI 第一次被写进政府工作报告,也意味着 AI 迈入受到广泛认可、全力加速的新时期。

随着 AI 技术的不断发展,大语言模型逐渐突显出语言能力强和处理非结构化数据准确率高、成本低的优势。近年来,企业普遍数字化转型过程中,通常面临建立数据中台或知识图谱成本过高的实际难题。而领域大模型为企业构建知识体系,推动数字化转型和促进新质生产力发展提供了新的解决方案。

政策和技术的发展,让人们对大模型高度关注,实际上早在 2014 年,中关村科金就已经聚焦营销服务、运营培训、陪练、质检等企业服务赛道,并为其提供 AI 对话场景服务,目前已在百余种对话场景中积累 PB 级数据。2023 年底,这家对话式 AI 技术解决方案提供商推出大模型系列产品服务,且领域大模型技术成功通过了国家网信部算法备案。

中关村科金技术副总裁张杰表示:“大模型面临着通用性、专业性、经济性的不可能三角,国内通用大模型赛道已初见端倪,领域大模型赛道上大家仍都处于起步阶段。领域大模型作为 AI 服务的‘最后一公里’,会长期存在。我们结合领域大模型的语言能力和领域知识库的事实知识能力,帮助高知识密度企业应用大模型技术,构建统一的知识中台,高效打造全媒体交互应用。 ”

通过为客户交付高性能的领域大模型和场景共创等形式,中关村科金助力企业实现数智化转型升级和显著的降本增效。此外,其还通过组合式 AI、持续学习、模型安全可信、平台化服务(MaaS)等核心技术能力,解决当前大模型普遍存在的专业性不足、合规性存疑、经济性偏低等局限性问题。

随着大模型技术的发展和应用的深入,中关村科金逐渐形成全新的大模型应用理念:围绕知识平权、决策平权和体验平权“三大方向”,布局大模型+的“八大应用”,即大模型知识助手、大模型平台、大模型+人机交互、大模型+BI 智能决策、大模型+洞察分析、大模型+防伪安全、大模型+消保合规以及大模型+智能办公和管理数字化。并已在多家头部金融机构、央国企、政务服务部门、多省市公安机关等机构的业务场景中落地多种大模型应用。

(来源:中关村科金)

推动 AI 在企业“最后一公里”落地

作为新质生产力的代表,AI 有望通过为企业各场景赋能实现生产力的飞跃。2023 年,国内涌现出两百多个大模型,被称为大模型元年,一时间掀起“百模大战”。大模型的火爆也打开了生成式 AI 的市场,除文本外,语音、视频等多模态交互能力已逐渐成为 AI 厂商竞争的关键。

“中关村科金从发展初期就具有清晰的定位:做领域大模型而不是基础大模型,融合多种技术能力,推动组合式 AI 在企业场景的‘最后一公里’落地。我们的领域大模型具备广泛的兼容性,可以灵活适配不同的基础大模型。这其中的关键在于高质量领域数据的积累和高效微调技术,基础大模型可以灵活替换。”张杰表示,之所以能够在技术浪潮到来之前进行布局,与中关村科金多年来的资源优势和技术累积密不可分。

他提到,早在 ChatGPT 出现之前,中关村科金便已建立起全栈自研的技术体系,包括自然语言处理、语音识别、多模态生物防伪、OCR 等多项 AI 原子能力,以及实时音视频通信、大数据等技术能力。

此外,在领域大模型微调技术方面,中关村科金拥有“独家绝活”。首先对不同任务做分区定位,然后找到不同任务间的协同增益关系,最后再对具体任务做分层微调。最终可实现数据量依赖更小、算力消耗更低、推理性能更高。需要了解的是,大模型在执行不同的自然语言处理任务时,会利用到不同的工作区域,这与人类大脑存在不同的脑区类似。

中关村科金能够用分区定位技术和分层微调技术对任务进行不同工作区域的“CT 扫描”,以实现定制化快速增强效果。通过对评测数据集的积累,评测模型擅长抽取、生成、多语言等,把领域知识快速、低成本地注入到通用大模型,进而为客户交付高性能的领域大模型。

张杰解释说道:“微调领域大模型是一件技术活,并不是简单地套个壳、灌些数据微调那么简单。需要打开大模型的‘黑箱’,我们独创的分层微调技术可对意图识别、情感分类或指代消解等 100 多项不同的 NLP 任务做精准增强。其中,在实现同等提升效果的前提下,领域标注数据可以降低到原来的 1/6。”

据悉,中关村科金通过历时半年的研究和开发,耗费 10 万卡天算力,整理出原子任务间的协同增益关系图,用于掺混数据,提升模型训练效果效率,实现单卡推理、单周迭代,单周完成模型微调,且能避免模型的灾难性遗忘。该技术使得通用大模型能够高效地被训练成领域大模型,并且结合领域知识库,满足企业具体场景的需求。

以金融行业企业知识库为例,在与某头部财富管理公司合作的客服场景下,中关村科金融合自研的企业知识大模型、智能客服等人工智能技术,为客户打造了智能知识库,具备多模态文档分析、QA 问答对自动抽取、知识内容自动标签化处理等能力。通过集成客户的企业微信和展业 APP 应用,帮助客户大幅提升客服系统问答意图识别和回复的准确率,减少文本客服 70% 以上的运营工作量,回答效果提升 50%+。

在积累资源与技术的同时,中关村科金的多项技术能力也逐渐得到了行业认可,并参与行业的标准认定。具体来说,其模型能力获中国信通院权威机构认证,具备全面的语义、语音、视觉等基础能力,在 5 个能力域、46 个能力项评测中准确度达 95%+,已达到当前国产大模型最高能力级别 4+,加速领域大模型高效商业化落地。

此外,中关村科金还参与多个行业首个大模型权威认证标准的制定,并且全面参与其他产品技术能力行业标准的制定,包括国内首个智能营销产品权威认证标准、中国信通院“可信人脸识别守护计划”、智能双录系统基础能力要求、实时音视频服务基础能力要求及评估方法等。

截至目前,中关村科金已累计申请受理 438 项专利,获得 329 项软著及 CMMI5 国际认证。数据资源方面,中关村科金服务 1600 多家企业的 200 多个场景数智化转型,累计服务超过 5 亿用户,积累了各领域大量的行业 Know How 和高质量数据。

授人以鱼,不如授人以渔:提升企业的大模型自主运维能力

大模型技术可见十年应用红利。但是,当前不少企业对大模型的认知还存在一些误区,特别是认为模型规模越大效果越好。事实上,尽管拥有更强大人机交互能力的大模型在性能上更加卓越,但它们并不是传统模型的替代品。

实际上,大小模型的创新组合式 AI 才是未来发展趋势。这种组合能够基于认知推理对复杂任务进行拆解、精密规划,并调用各类模型。通过这种方式,可以实现更为精准的风险分析、预测与决策。例如,大模型加小模型、决策引擎、关键词、规则设置等。

另一方面,从技术角度来看,虽然近年来大模型发展速度快,但它更像是一个成长中的孩子,因此大模型并不是一步到位,而是需要持续学习。

此外,不容忽视的是,当前大模型具有专业性不足、合规性存疑、经济性偏低等局限性。唯有攻克了这些问题,才能解决大模型“最后一公里”。

为解决上述难题,中关村科金构建了组合式 AI、持续学习、模型安全可信、平台化服务(MaaS)四大核心技术能力。

张杰表示,大模型本质是语言和世界常识的知识库,中关村科金通过知识注入与外挂知识库“双管齐下”的技术手段,让企业形成一套实用的“技术+制度”,不仅能够保障人类员工的行为数据或业绩数据形成闭环,还可以让大模型越用越“聪明”。

据介绍,为降低用户的产品运维成本,中关村科金在交付产品时,还会提供一套易操作的工具包,让用户可自主运维,从而进一步提升产品使用体验和效率。与此同时,应用开发平台可通过零代码的方式开发大模型应用,全面满足企业需求,有效降低企业内部应用的创新成本、缩短试错周期。

在产品安全性和隐私保护方面,中关村科技采取了全面而细致的措施。在事前阶段,实施精准的数据筛选和严格的数据净化,以确保数据的纯净性、安全性和全面性。在事中阶段,累积了丰富的法律法规和行政案例知识,可进行合规加训。在事后阶段,通过“幻觉检测”等后处理技术,进行深入的安全性检测和风险评估,从而确保产品的稳定性和用户的隐私安全。

需要了解的是,由于大模型是一场新的技术革命,因此完全在企业各场景落地应用还需要一定的周期。

短期来看,可发挥其记性好、理解能力强,能读懂非结构化文档等语言能力强的优势,作为助手类应用,如知识助手、写作助手、陪练助手赋能企业内部员工。

目前,很多企业存在海量的非结构化文档,过去想将它们利用起来,需要训练小模型或人工标注数据,再加工成知识图谱,因此解析的成本非常高。

在知识密集型的行业领域里,企业员工每天都要与海量的文档和信息打交道,包括不同类型的研报、报告、通知、公文等。张杰认为,定向写作助手有望成为近期爆发的商业需求。

中期来看,在已建好的统一知识库基础上,结合更多的领域知识用在对话场景。比如,打电话进行老用户召回、自动回访已成交用户、为客服坐席赋能等。

从 2024 年上半年开始,中关村科金已经陆续与多家头部券商共创,在智能投研和智能投顾领域进行尝试。由于大模型撰写的文案内容更具针对性和多样性,复杂金融产品销售比例提升至 30%。与此同时,与某银行在合规场景进行大模型应用共创,深挖内规、外规和法律法规相关的领域知识,赋能金融业务各环节的合规把控。

中关村科金在公安领域反诈警情的场景与某省公安厅进行共创。基于反诈知识库数据领域微调,打造反诈智脑并取得了显著成效。大大提高了警务人员的工作效率,并减轻了警务人员的工作负担,大幅减少人民群众的财产损失。此外,中关村科金还在工业运检领域研发出运检助手,为运检人员提供最佳实践指引,单笔工单的检修效率提升 30%,降低了人工运营成本。

长期来看,大模型需要在基础语言能力上,通过有效集成事实性知识和流程性知识,逐渐增强推理决策能力,例如运维检测、金融风控等。

张杰表示,希望未来可通过生成式 AI 技术构建人机协同的新型生产关系,以帮助企业打造“超级员工”,实现具有分析决策能力的强 AI 应用。

结语

随着大模型技术的快速、持续发展,赛道将会变得越来越拥挤,大模型领域也面临着技术洗牌的变革趋势。

因此,对于领域大模型产品应用服务商来说,一方面,既需要具有强大的技术能力,实现快速、低成本地微调领域大模型;另一方面,也需要在 AGI 的发展道路上,基于现有语言能力和丰富的行业 Know How 积累,增强大模型对事实判断和价值判断的能力。

对于解决行业/企业的更多问题、在更多场景应用以及实现生产力变革方面,领域大模型的未来值得期待。

0 阅读:0