我们在四大预测中强调了智能数据平台和人工智能代理的崛起。虽然这些趋势在 2023 年不太明显,但人工智能代理背后的势头现在不可否认,表明进一步加速。人工智能和人工智能代理的主流化继续有增无减。
在数据平台方面,我们观察到在简化用户体验并加速数据和人工智能产品开发的需求的推动下,向智能、统一平台的强劲转变。随着越来越多的供应商进入市场,这种趋势预计将会加剧,从而扩大企业的选择范围。
2025 年会发生什么随着 2025 年的临近,企业数据和人工智能的格局将发生重大变革,重塑行业并重新定义人类与技术的互动。我们不想将其称为预测,而是希望利用本文档来探索这些我们认为需要企业高管和技术经理密切关注的变革趋势。因此,读者应该将其用作确定优先事项并让组织做好选择正确选择的指南。
话不多说,让我们进入趋势,我们相信这可能会主导企业数据和人工智能领域。图 1 展示了分类为“应用人工智能”、“数据与运营“的趋势。
图 1:2025 年数据和人工智能格局的特点是代理的崛起、数据平台的演变以及对有可能改变我们周围世界的雄心勃勃计划的追求。
应用人工智能:这些趋势将显着影响企业如何利用人工智能模型进行转型,特别是代理如何自动化日常任务和功能。随着模型推理的不断进步,这些代理将不断发展以处理日益复杂的任务并无缝协作。数据和平台趋势:支持结构化和非结构化数据的融合数据和元数据平面将推动人工智能并成为代理和人工智能应用程序的基础。几个关键趋势正在汇聚以支持这一愿景,包括数据平台管理的进步和用于代理应用程序的强大中间件的开发。应用人工智能2025 年应用人工智能趋势以代理的实际应用和主流采用为中心。如图 2 所示,我们确定了四个关键子主题,有望在该类别中产生最重大的影响。
图 2:就像机器学习一样,人工智能的民主化将通过蓬勃发展的代理生态系统来实现,该生态系统可解决广泛的任务和特定领域的挑战.
接下来让我们回顾一下各个AI/AI应用趋势。
全程代理2025年,我们进入代理人工智能时代。
以下为AI代理的摘录以及我们对去年趋势对企业的建议。有兴趣查看详细信息的读者,请访问[ 1 ]
人工智能信息代理是一种趋势,我们相信这可能会持续多年;然而,鉴于他们的承诺,我们预计 2024 年将在代理基础设施/工具以及早期采用方面取得重大进展。需要指出的是,我们如何理解当前人工智能架构承担更复杂任务的潜力,很大程度上仍然取决于潜力,而且还有很多未解决的问题。
尽管如此,企业必须以一种实用的方法来构建代理应用程序,并期望在某种程度上,与当前人工智能技术的差距将呈现出越来越复杂的自动化,而且这种差距可能会逐年缩小。它还必须考虑未来 12 个月内各个用例可能实现的自动化程度。此类项目的进化路径/旅程可能会通过此类努力取得更好的成功。
由于对重复性任务自动化和增强客户体验的需求不断增长,智能自主人工智能代理的采用预计将在 2025 年加速在企业中的采用。这些代理将增强人类的能力,使我们能够专注于创造性、战略性和复杂的工作。
它们将自动化扩展到需要高级思维、推理和解决问题的任务——目前需要大量人工参与的任务。例如,代理可以执行市场研究、分析数据或回答客户支持查询。他们还可以自动化以前因复杂性、成本或两者兼而有之而被认为不切实际的复杂、多步骤工作流程。
[ 2 ] 中提供了 AI 代理的全面解释、定义和分类。
人工智能代理是一个程序或系统,可以感知其环境、推理、将给定任务分解为一组步骤、做出决策并采取行动来自主完成这些特定任务,就像人类工人所做的那样。
目前,我们正在见证人工智能驱动的工具的出现,例如开发人员副驾驶员,每月价格约为 20 美元,以及像 Devin 这样的早期代理,价格为 500 美元(仍然代表 2 级自动化解决方案)。 2 级人工智能代理可以自主执行某些任务,但仍然需要大量的人工监督和干预。
然而,到 2025 年,我们预计将出现更先进的代理商,其价格点也会相应更高,反映出他们所提供的价值。例如,在制定部门的漏斗顶部入站和出站营销策略方面,一位能够超越初级营销人员表现的专职代理可以开出 20,000 美元的价格。
多Agent系统多代理系统 (MAS) 使多个自主代理能够协同工作、通信和协作,以解决单个代理无法克服的复杂挑战。 MAS 内的这种专业化允许每个代理专注于其专业领域,当代理贡献其独特的技能和知识来解决复杂问题时,提高系统的整体效率。这些代理相互交互,经常使用不同的通信模式和渠道,以实现其个人目标或总体系统目标。
图 3 说明了多个代理如何协作以增强组织内的内容生成。
图 3:由三个代理组成的多代理系统,专门从事内容研究、创建和发布任务,协作以满足营销部门的需求。
MAS 可以通过常见的架构模式进行通信和协调,从而展现出不同级别的控制和不同的架构模式:
层级团队:这种类型的 MAS 通常采用中央管理者或任务委派者来协调沟通。系统内的工作代理仅通过该中央代理进行通信,从而防止代理间直接通信。点对点:在点对点 MAS 中,代理直接相互通信,而不依赖于中央机构。群组协作:这种类型的 MAS 类似于群组聊天(例如,Slack、Microsoft Teams),其中代理订阅相关频道并通过发布-订阅架构进行协调。与单代理系统(其中一个代理处理多个角色)不同,MAS 可实现高效的专业化,从而提高各种应用程序的性能。 MAS 对于扩展复杂的代理自动化至关重要;单个代理的任务超载会带来复杂性和可扩展性/可靠性问题。
我们预见到企业发展更多专业代理商的趋势。这些代理必须以团队配置进行协作和协调,以实现更大、更复杂的工作流程。因此,MAS 将在代理驱动的工作流自动化计划的整体成功中发挥至关重要的作用。
有关 MAS 必要性的更多示例和讨论,请参阅[ 3 ]。
代理管理系统代理管理系统 (AMS) 有助于人工智能代理的开发、评估、部署和部署后监控。通过简化这些代理的创建和改进,AMS 可以实现更快的迭代并简化生命周期管理。它还通过彻底的部署前测试和持续的生产监控来确保代理满足预期目标。
图 4 显示了代表性 AMS 的组件。
图 4:代表性代理管理系统 (AMS) 的组件
代表性的 AMS 包含以下组件:
代理构建器:代理构建器通常称为代理框架,有助于快速创建新代理并支持对现有代理进行迭代改进。代理注册表:代理注册表维护可用代理的目录,并促进访问控制和治理,合并版本管理以确保目标受众的适当访问。代理游乐场:代理游乐场提供用户友好的即插即用界面,用于针对各种任务和用户查询手动测试代理。此环境允许快速评估代理性能。代理实验:代理实验支持对代理进行自动部署前评估。这种结构化方法通过定义数据集、选择适当的指标、配置环境、分析结果和生成评估报告来评估代理性能。以前运行的实验日志通常也可用。部署和监控:代理部署涉及在临时或生产环境中为代理提供必要的资源,同时监控跟踪相关的运行时指标。这确保了代理的可靠性和有效性。聊天 UI:聊天 UI 提供与生产环境中部署的代理交互所需的用户界面。我们预计企业将部署大量专用代理来解决广泛的特定领域任务。 AMS 将发挥关键作用,使组织能够在整个生命周期中大规模创建、部署和管理这些代理,从而实现代理企业。
任务特定模型尽管 Anthropic 的 Claude、OpenAI GPT 系列、Google 的 Gemini 和 AWS 的 Nova 等领先模型在 2024 年占据主导地位,但在任务和特定领域模型的开发方面出现了一些值得注意的趋势,尤其是与企业用例相关的模型。
图 5 说明了此模型创建过程中涉及的步骤。这个过程通常称为训练后对齐。
图 5:用于创建领域模型的技术
监督微调监督微调 (SFT) 涉及使用偏好数据集训练基础模型(通常是预先训练的基础模型或指令调整的变体)。在思想链(CoT) 对齐的背景下,该数据集中的每条记录通常包含(提示、CoT、输出)三元组,CoT 明确引用相关安全规范。
上下文蒸馏过程创建数据集,从专门为有用性而训练的模型开始,并通过安全规范和相关提示进行提示。这个过程的结果是SFT 模型。
2. 强化学习微调
第二阶段采用高计算强化学习(RL)。此阶段使用法官LLM根据模型遵守安全规范的情况来奖励信号,进一步完善模型的安全推理能力。至关重要的是,除了最初的规范创建和高级评估之外,整个过程需要最少的人为干预。
CoT 推理允许LLM明确阐明其推理过程,使其决策更加透明和可解释。在 RL 阶段对齐中,CoT 包含对安全规范的引用,展示模型如何得出响应。这使得模型能够在生成答案之前仔细考虑与安全相关的考虑因素。将 CoT 包含在训练数据中使模型能够学习使用这种形式的推理来实现更安全的响应,从而提高安全性和可解释性。此阶段的输出通常称为“推理模型”
3. 持续微调
持续微调使人工智能工程师和数据科学家能够使模型适应特定的用例。深度学习工程师和数据科学家现在可以使用少至 10 到 1,000 个示例来微调前沿和开源模型,从而显着提高目标应用程序的模型质量。这对于寻求增强特定用例的模型可靠性而不投资大量的培训后基础设施的企业至关重要。
大多数前沿模型现在都提供持续微调 API,用于偏好调整和强化学习微调 (RLFT),从而降低了创建特定于任务或特定领域的模型的进入门槛。
此阶段的输出可以称为“任务或领域特定模型” 。
Hugging Face Transformers 强化学习 (TRL)、Unsloth 等开源微调框架为 OSS 模型提供了类似的持续调优功能。例如,Llama 模型的早期采用者自发布以来已对其进行了超过 85,000 次微调。
随着我们继续在企业中采用主流人工智能,我们观察到两个明显的趋势:
拥有大量资本资源的组织(我们称之为“前沿企业”)可能会采用培训后开源模型的策略,通过不断的微调,针对特定领域和用例进行广泛定制。对于预算有限但非常注重可靠用例的有抱负的企业来说,具有成本效益的策略是选择现成的LLM ,并通过持续微调优先考虑特定于任务的协调。有关训练后对齐的进一步阅读,请参阅[5]
数据与运营趋势数据对于成功实施人工智能至关重要,需要数据管理最佳实践。图 6 说明了 2025 年主要数据和运营趋势。
图 6:关键数据和运营趋势
让我们更深入地探讨每一个。
智能数据平台为了加速数据和人工智能创新并减少运营开销,我们提出了在 2024 年建立统一、智能的数据和人工智能平台 (IDP)。这种统一和简化工作在主要软件提供商中获得了巨大的关注,形成了如图 7 所示的架构。
图7:智能数据平台架构
IDP 简化了整个数据生命周期(存储、处理、分析和机器学习)的集成,减少了对分散工具和手动工作的需求。它还为数据治理政策和执行提供了集中式框架。有关 IDP 架构的详细概述,请参阅 [ 1 ]。
尽管 2024 年成熟科技公司和初创公司的主要产品不断增强功能,但人工智能代理的数据和人工智能平台的广泛采用仍在继续。
到2025年,数据平台供应商将继续整合他们的服务,通过提供这些应用程序运行和决策所需的信息,为人工智能代理和多代理系统奠定重要基础。这些平台抽象了三个关键功能:
统一数据平面:统一数据平面支持不同数据格式的加入、存储、管理和治理,包括文本(例如 PDF)、图像(例如 PNG、JPEG)和音频/视频(例如 MP3)。这个统一数据平面的一个关键子趋势是采用开放表格式,例如 Apache Iceberg、Delta Lake 和 Apache Hudi。统一元数据平面:元数据为人工智能应用程序提供有关其处理数据的基本上下文信息。例如,如果数据包含人力资源政策文档,相关元数据可能包括文档的版本号、上次修订日期和作者。如果没有丰富的元数据提供这些细微差别,代理将在建立足够的上下文和提供预期功能方面遇到困难。多引擎编排器: IDP还提供了一个可扩展的编排层,旨在管理和协调各种计算引擎,包括用于分析处理、数据转换和人工智能模型执行的计算引擎。治理平面:IDP 还充当访问控制、治理和个性化中间件,使代理能够更好地了解用户角色(包括角色、数据访问和查询历史记录)并个性化响应。人工智能 ETLETL(提取、转换和加载)是为人工智能和机器学习模型准备原始数据的关键数据集成过程。此过程涉及从各种来源提取数据,通过清理和格式化对其进行转换,然后将其加载到数据管理或存储系统中,例如前面描述的 IDP、数据仓库或向量存储。
虽然企业已经熟悉结构化数据的 ETL(从操作数据库中提取、转换数据并将其加载到仓库或数据湖),但 AI 的 ETL 扩展了此过程以涵盖多种数据格式,包括文本(.pdf、.md、.docx) )、音频/视频(mp3、mpeg)和图像(jpeg、png)。
这些非结构化数据源可能包括企业使用的各种内容存储库、应用程序和网络资源。事实上,ETL 流程本身可以利用 AI 来执行提取任务,例如使用多模态大语言模型 ( LLMs ) 或光学字符识别 (OCR) 模型从 PDF 中提取实体(图像、表格和命名实体)。
非结构化数据的 ETL支持各种下游用例:
AI 驱动的见解:检索增强生成 (RAG) 使应用程序能够促进用户与文档的交互、提取关键摘要并支持类似的用例。从 SharePoint、Dropbox、Notion 以及各种云存储库和应用程序等不同来源提取和转换数据将成为人工智能驱动洞察的关键推动因素。我们预计供应商将继续抽象 RAG,将其作为易于访问的功能集成到统一数据、分析和人工智能平台中。AI搜索:与传统关键词搜索相比,增强了企业内容的可访问性和智能性。人工智能驱动的自动化:从非结构化数据中提供必要的知识层,为代理提供必要的上下文信息。培训后调整和持续微调:促进新数据和更新数据的可用性,为各个部门用例实现模型的无缝和持续个性化。人工智能的数据准备数据准备是成功实施任务特定模型和人工智能代理的基础。
这是此类举措取得成功的关键“先决条件” 。
为了使数据可用于人工智能,需要在多个维度上全面准备好数据。虽然人工智能几乎可以消耗企业拥有的所有可用数据,但正确的方法是从优先考虑的用例中得出数据准备要求。
图 8 说明了人工智能数据准备度的一些关键维度
图 8:人工智能的数据准备情况
数据质量和可观察性该数据是否通过既定的质量指标?这可能意味着以下一项或多项:
相信新鲜正确性元数据的完整性血统合法性/偏见关联版本控制上述指标是如何实时管理、跟踪和呈现的?
可观测数据数据沿袭修订历史人工智能数据产品数据产品是特定任务模型、人工智能模型和代理应用程序的基准测试和测试成功的关键。一些重要的人工智能数据产品包括:
训练就绪数据集:标记数据成为有价值的数据产品,可立即用于人工智能训练。思想链 (CoT) 数据集:与通常为训练提供输入和输出的传统数据集不同,CoT 数据集还包括解释如何得出答案的中间推理步骤。这种分步推理方法与人类解决复杂问题的方式密切相关,使得 CoT 数据集对于训练 AI 模型执行需要逻辑推理、规划和可解释性的任务非常有价值。蒸馏数据集:提供较小的代表性数据集子集,以捕获完整数据集的多样性和可变性。蒸馏数据集的一些示例是:一个。客户评论的子集,捕捉不同的情绪水平和产品类别。
b.创建的高质量任务特定数据集,用于训练较小的模型(学生模型)以模仿更大、更复杂的模型(教师模型)的性能。
c.为微调技术问答模型而提炼的技术文档子集。
4. 合成数据集:用于生成模仿原始数据集核心属性的合成数据集的蒸馏数据。它们通常用于增强数据可用性稀缺或不平衡的真实数据集。通过生成变体,可以在更多样化的数据集上训练模型。
5.知识图谱数据集: GraphRAG支持的数据产品利用基于图的数据检索和生成的功能。例如,连接医学术语、诊断、治疗和患者结果的医疗保健知识图数据集可用于提供个性化医疗建议、建议可能的治疗方案并帮助医生做出数据驱动的决策。
6. 用户数据:用户数据对于构建更智能、个性化的人工智能应用程序至关重要。这些数据通常包括有关用户角色和用户交互或输入的任何信息,AI 代理或应用程序使用这些信息来理解用户角色,代理可以利用这些信息来提供有意义的输出或响应。部分用户数据示例如下:
一个。具有有关用户角色和用户的数据集/查询/仪表板交互历史的信息的数据分析代理可以通过过滤和选择适当的数据集访问历史和查询运行来个性化查询响应。
b.了解用户的客户状态(例如,高级或普通)以及他们过去支持请求的性质的客户支持代理可以使用过去的票证、问题和解决方案来确定响应的优先级、提供更快的解决方案或推荐特定的知识库文章。
c.销售代理通过分析过去的沟通历史以及与潜在客户和客户的互动模式,可以个性化后续策略,推荐特定的产品或服务,并根据潜在客户的历史行为对其进行优先级排序。
认知主体认知主体积极、持续地学习经验并不断适应和改进。图 10 描绘了认知主体的定义特征。
图10:认知代理的五个关键特征:学习、记忆、自我意识、自我完善、自我升级
除了人工智能代理的通用功能之外,认知代理通常还没有其他能力:
记忆保留较长的记忆保留能力是认知主体的关键特征之一。记忆保留能力使代理能够回忆起以前的对话,通常会记住特定事件,包括发生的地点和时间,并经常从中学习。
因此,认知代理具有复杂的记忆架构,其中包括用于保留的长期存储和特定形式的记忆(例如情景记忆),这使得代理能够及时返回并回忆起特定事件,包括地点和时间。
情景记忆的一个示例是回忆先前事件中成功完成任务的步骤。如果代理再次面临相同的任务,它可以回忆起之前成功实例中所采取的确切步骤,并在这次更有效地执行它。
2. 从过去的互动中学习
这些代理从过去的交互中学习,并利用所学到的知识在未来做出更好的决策。
3.自我意识
这些代理可能进一步了解他们自己的构建细节和能力。
他们可以从用户交互中学习并更新其知识库以获取新的知识。
4.自我修复
自我修复使代理能够通过添加新功能(例如工具)、根据最近的交互创建偏好数据集并触发下一个微调作业来扩展其功能。它可以进一步评估新模型,并将新模型修订版注册到模型注册表中,同时生成详细的模型报告供人工智能工程师审查。
5. 自我升级
(可选)代理可以自行升级到上面创建的新模型修订版。
体现代理人实体代理是一种像机器人一样具有物理存在的人工智能代理。这个“体现”至关重要,因为它允许智能体像人类一样在物理世界中感知和行动,使其能够学习和执行需要智能体对其物理空间有丰富理解并根据任务采取行动的任务分配的。生成式人工智能有望超越传统的基于规则的编程,在更复杂和动态的环境中运行,从而彻底改变机器人技术。
图 11 描述了企业如何将这些新型代理用于广泛的应用。
图 11:使用嵌入式代理的企业示例。
让我们探讨一下银行如何使用实体代理。其分支机构的具体客户支持代理可以发起与上门客户的首次互动,提供个性化的财务建议并帮助进行交易。
在零售业中,实体代理可以采取店内购物助理的形式,提供产品信息并引导商店购物。在制造业中,这些代理可以处理需要机动性和灵活性的任务,以完成对人类安全有危险的任务。
代理网络目前,由于缺乏标准化的消息格式、协议和冲突解决机制,多个人工智能代理之间为实现共同目标或复杂问题而进行的有效通信受到阻碍。未来的网络方法必须是可扩展的、低延迟的和安全的,在代理之间建立信任并保护通信网络免受恶意攻击。
这让我们看到了代理网络改进的最后一个预期趋势。
有效的座席网络可以彻底改变座席在企业内部和外部的沟通、协作、协调、完成工作和学习的方式。这一趋势与早期的内联网和互联网协议标准化以及 Web 2.0 时代社区和论坛的演变相似。这些趋势显着增强了人与人之间超越物理界限的协作。
图 12 显示了建立有效代理网络的四个选项。
图 12:可能的代理网络标准示例
认知代理可以通过分析交换数据、更新自己的知识库、分析交换数据、像人类一样改进通信以及加速跨企业边界的创新,通过这些交互进行学习。
结论回顾和总结,应用人工智能趋势是加速企业中人工智能代理和应用程序的有意义采用的趋势,而数据和运营趋势提供了支持和加速这些代理应用程序的坚实基础。
一如既往,这项研究的目的是关注技术解决方案而不是组织影响。自主代理自然会引起人们对工作取代的担忧,因为人工智能代理预计将接管重复性任务。企业需要重新发现人类和人工智能代理之间的协同/协调,批判性地重新定义工作角色,并创建围绕人工智能的创建、管理和协作的新角色。因此,这种转型带来了另一项重要任务,因为大多数企业在进行人工智能转型的同时,还需要对其员工进行严格的技能提升和再培训。
最后, LLM模型架构的任何突破、带来具有成本效益的自适应知识注入或理解和推理能力显着提高的解决方案都有可能进一步影响人工智能应用的潜在现实。