来源 | 零壹智库
“大模型是人工智能发展的新阶段,在技术上有创新突破,但还没摆脱一些传统问题。”
2024年8月16日,在零壹智库与苏州高铁新城产业发展有限公司联合举办的“金融数智化系列研讨会之:金融大模型的机遇与门槛”会议上,来自北京国家金融科技认证中心(简称“国金认证”)实验中心的技术专家对中国金融大模型发展的挑战和机遇做了深入剖析。他同时介绍,国金认证正在通过建立一系列的标准,为金融机构在大模型的高效、安全应用方面提供帮助。
本文是对会议相关观点的记录和整理。
零壹财经:金融业是大模型垂直应用较多的行业,从过去的经验看,金融业对于先进技术的采用一直都是非常积极的。当前中国金融大模型的发展状态如何?
国金认证专家:金融机构对大模型的应用处于积极的态势。大家都认识到,大模型等新一代的人工智能对我们工作的变革影响是巨大的。金融行业的大模型既有面向客户的智能客服类应用,也有大量面向员工的智能助手类应用。我们讲金融科技的主要技术ABCDE,其中A(AI)一直是与业务最贴近、影响最深远的。
零壹财经:国内已有超过20个金融大模型,您认为金融业在选择大模型应用时有什么难题?
国金认证专家:我们认为大模型是人工智能基础算力+算法模型+行业场景的综合体。
首先要解决算力底座的问题。Nvidia等产品的先进型号目前对我们限制出口,好在国内GPU芯片厂商百花齐放,也出现了许多优秀的算力机构。但是,在芯片方面,与国外相比,我们还存在一些差距,主要表现在:
单卡算力相对较好,但集群算力性能差距较大;
不同算力卡的能力倾向有差别,在适应不同的算法上效果不同;
技术架构和生态不完善,国内厂商面临着选择兼容英伟达CUDA架构或自力更生的问题,前者限制多,后者挑战更大。
现实情况使金融机构在搭建算力的过程中可能要选择不同的算力卡。考虑到金融机构信息系统的建设情况和运维要求,兼容不同算力卡、发挥不同算力卡的优势能力、整体建设异构化的算力平台成为实际需求。
目前,国金认证正在研究基于不同底层算力的异构集群调度平台的技术标准,帮助金融机构选型AI平台的技术产品,更好地聚焦用好AI的应用层需求。
其次,大模型的技术选型方面,既有开源的大模型、又有商业的大模型,二者还没有到决一胜负的时候。
我们看到在很多高校的加持下,开源大模型在参数量等方面提升很快,但开源技术也往往面临着社区松散、后期维护不足等问题,值得我们关注。商业大模型也需要积极拥抱开源,毕竟开源是目前高效的协作开发方式。
对金融机构而言,从开源技术入手可能更快捷。大型金融机构技术实力强,可以在开源技术上不断演进。中小型金融机构可能更倾向于成熟好用的商业化产品。
最后,是金融大模型的应用方面。大模型必须深度和金融业务场景融合发展。如果只是泛泛而言金融大模型,那就做不到有的放矢。还需要根据行业场景的需要去使用大模型,营销获客、交易风控、贷后催收等不同业务场景,内部员工使用还是直接面向客户,他们的业务规则不同、监管要求不同、数据使用也不同。
所以,目前虽然大模型很多,但是聚焦到行业应用本身,还有很多细致的问题需要解决,尤其是安全性的一些要求。
零壹财经:影响大模型成本的另一大问题是能耗。近年来金融业一直在推进绿色金融的发展。发展金融大模型,是否会在能耗上遇到两难?
国金认证专家:大模型的能耗问题很复杂,我认为他是一个综合性问题。回归本源,我们一定要关注用大模型做什么,不能仅仅关注模型本身。
首先,是大模型的能源消耗。从技术层面,要优化模型的算法,不要一味的追求参数数量,而是更好地解决精准性问题,做到高效。另外,要通过液冷数据中心等绿色能源技术综合性降低能耗。
其次,要关注大模型的部署模式。通常认为,大模型在使用过程中可分为训练阶段和推理阶段,前者对算力的要求相当高。金融机构自身到底需要投入多大的成本去建设,这是一个非常难的话题。
我们认为,一些基础模型的训练,通过云平台的算力去做可能更容易,这也符合云计算集约化降低成本的目标;具体推理阶段,结合金融机构自身情况来建设算力会更高效。不过,混合部署模式对数据安全是有挑战的,基础模型、金融机构自身的模型之间如何协同训练,有很多细节需要进一步探究。
最后,还需要关注大模型的应用效果,每个行业都在谈数字化转型,实际上就是需有一套评价指标,对大模型使用前后的情况(比如业务提升、效率优化等各个方面)进行综合评价,从而判断能耗投入是否取得好的效果,确保大模型有好的投入产出比。
总而言之,绿色不是孤立的,要用发展的眼光看问题。
零壹财经:刚提到金融业对数据安全、数据隐私的要求非常高,而训练大模型需要海量的高质量数据。金融业如何合规、安全、有效地使用数据,训练更加高效、精准的大模型?
国金认证专家:在大模型的训练中,需要结合行业自身数据的特点,并且合理的运用安全技术。
一方面,金融行业的数据涉及到用户的个人信息、资产信息等等较为敏感的数据,按照监管要求,数据是不能出域的。当然,金融机构也用到很多其他领域的数据,包括政务等公共数据,这些数据有很多是面向社会公开的,并非金融机构才能使用。我们要根据不同数据的来源、用途等识别他们的保护要求,从而确定哪些数据可用、哪些数据不可用。
另一方面,从技术上来看,云端和本地化混合云的部署模式,可能必须要结合隐私计算等技术保障数据的联合建模安全性。金融行业有很多数据的安全管理规范、技术标准,但在大模型时代,他们在模型训练、推理中到底起到了什么作用,哪些数据要进行脱敏化处理,需要结合大模型的应用场景和用户需求形成行业最佳实践。
零壹财经:虽然面临种种难题,但业界也在努力推动金融大模型的发展。从实际应用情况来看,目前金融大模型遇到了哪些难题。
国金认证专家:金融大模型的应用,前面我们其实已经谈过了算力等资源上的问题。我认为除此之外,还有两方面的挑战。
第一,行业大模型的应用场景挑战。调研显示,对银行业金融机构而言,大模型在员工助手和代码生成方面有较好的实践和应用,而这两点在其他行业也有较强的通用性,我认为算不上是真正的金融大模型。涉及到金融信贷、风控等金融业务场景,大模型的实际应用就相对谨慎了。
这是由于行业属性的限制导致的,金融就是信用,涉及到信用问题,就必须应对大模型的幻觉挑战。所以,在行业中,大模型到底怎么用,还需要加强探索,对过去的业务规则、行业场景、技术因素等综合分析,实现用大模型为行业赋能,而不是为了应用技术而应用。
第二,大模型安全性有新的挑战,主要是由于其迭代速度快产生的。传统硬件产品一般具有十年以上的生命周期,传统软件通常认为有3-5年的生命周期,而大模型每年都有多次迭代。我们说大模型的安全性,不是这个版本测评完安全,下一个版本就没问题,它是一个动态更新的过程。
另外,大模型在更新、攻击技术也在更新。以人脸识别这一场景应用为例,过去我们解决了很多因为摄像头捕捉头模、照片、视频这些虚假元素的问题。但是,随着生成式大模型,尤其是视频类生成技术的飞速发展,通过视频伪造虚假身份,可以实时模拟人的一些动作,安全问题就更严峻了。
所以,对大模型的安全保障,一定是动态、持续的、不断更新的测试过程,我们希望未来用一些自动化工具和不断完善的数据集来解决这类问题。具体如虚假人脸的安全攻击,我们最近正在做标准和工具集,希望为行业的身份认证安全提供更多保障。
零壹财经:国金认证将有哪些举措,促进金融大模型低成本、高效率、同时合规发展?
国金认证专家:国金认证是在中国人民银行指导、市场监管总局批准下成立的一家专业从事金融行业检测认证的服务机构。近年来,在金融科技发展过程中,国金认证坚持在金融行业“传递信任、服务发展”,参与构建一系列金融新技术应用的相关标准,为技术产品进入金融行业把好质量关,为金融机构在数字化转型过程中提供技术支持。
大模型是AI深化发展应用的新阶段,国金认证还将继续发挥行业级检测认证机构的职能,以标准为引领,与相关方共同驱动新技术平台发展,打造金融与科技融合共生的新生态,促进AI技术在金融领域的融合,为不同类型、不同规模的金融机构更好地拥抱AI提供更多实践经验和应用范式。