GretelNavigator全面上市,为企业提供高质量合成数据

拥抱科技有未来 2024-06-18 19:03:28

合成数据生成领域领导者Gretel宣布全面推出Gretel Navigator,这是一种基于代理的复合生成式人工智能系统,旨在为人工智能开发自动化的数据创建和管理j进程。通过简单的自然语言或SQL提示,Gretel Navigator使用户能够创建、编辑和增强表格数据,并从头开始设计实时、高质量的测试和训练数据集。开发人员还可以利用现有的数据集,根据需要生成富有洞察力的合成数据。

Gretel联合创始人兼首席执行官Ali Golshan表示:“无论是构建检索增强生成(RAG)系统、训练基础模型,还是针对特定任务对LLM(大型语言模型)进行微调,高质量的数据都是成功的最重要因素。”“但获取这些数据不容易。抓取网络导致质量不一致,私人数据不能提供足够的保护。与此同时,手动数据标记既耗时又昂贵,在真正的工作开始之前,就需要数周甚至数月的数据准备。”

Gretel Navigator通过使开发人员能够生成可定制的、逼真的合成数据集,在不损害个人隐私的情况下模拟现实世界的模式,从而解决了数据采集方面的传统挑战。Navigator支持广泛的数据格式、模式和特定于上下文的优化,以简化工作流程并加快人工智能项目。

Gretel的联合创始人兼首席营销官Alex Watson表示:“有了Navigator,开发人员设计所需数据的速度比人工管理技术快10倍。““开发人员可以在几小时内从零到就绪的模型数据产品。Navigator让他们坐在驾驶座上,使他们能够专注于创新,而不是数据管理工作。”

Gretel Navigator由一系列预先训练的人工智能模型提供支持,其中包括Gretel的自定义表格LLM,该模型在各种公共和专有数据集(包括电子健康记录、财务文件和市场数据以及其他行业特定格式)上进行了训练。这使系统能够生成高质量、垂直特定的合成表格数据,这对企业人工智能应用程序至关重要。

安永客户技术平台主管Pablo Cebro表示:“按需访问高质量、安全的表格和文本数据,极大地提高了我们的运营方式,加快了我们为客户提供价值的速度。”“数据质量和安全是安永的首要任务。坦白地说,我们用Gretel Navigator生成的数据比实际数据要好。它更完整、更准确、更经济。它大大加快了我们的产品开发和人工智能路线图。”

Gretel Navigator结合了隐私增强技术,如差分隐私,并解决了人工智能开发的关键挑战,如行业知识差距和有限现实世界数据集的历史偏见。它还可以防止模型漂移等问题,并提高高价值人工智能应用程序的整体模型准确性。通过实现安全、实时访问和定制优化的敏感或专有训练数据,Navigator使开发人员能够构建最先进的模型,这些模型可以不断学习并适应关键的现实世界反馈。

除了安永,Gretel Navigator还加速了微软、谷歌、Databricks和AWS等领先公司以及Athena Intelligence和Dataclay等新兴人工智能初创公司的人工智能计划。Gretel Navigator也是世界上最大的开源文本到SQL数据集背后的人工智能系统,该数据集由超过100,000个高质量的合成文本到SQL样本组成,其元数据跨越100个领域和垂直行业。自4月份发布以来,该数据集已被下载超过1万次,并用于各行业的人工智能模型的训练和微调。

0 阅读:0