GraphRAG如何提高LLM准确性并支持更佳决策

拥抱科技有未来 2024-11-09 10:26:41

数据已经是现代组织的命脉,而企业理解其数据的能力更是无价的。知识图谱作为机构组织的集体“常识”,使企业能够深入了解其数据。他们通过从数据之间存在的关系和背景中得出见解来做到这一点。这种增强的理解使企业能够做出更明智、更一致的决策,从而推动积极的业务成果。

现在,进入检索增强生成(RAG)。简而言之,RAG是一个优化大型语言模型(LLM)输出的过程,使其提供更准确、可靠的信息。当RAG被知识图增强(称为GraphRAG)时,它显著提高了LLM的准确性和长期推理能力。

GraphRAG仍处于起步阶段,但有充分的理由相信它可以将LLM精度提高三倍。GraphRAG即将迎来生成人工智能的下一个时代,并最终将引领我们走向神经符号人工智能,即人工智能技术的“圣杯”。

让我们仔细看看这项技术巨大潜力。

利用知识图解决RAG的局限性,知识图以两种关键方式解决了与RAG相关的局限性。

首先,它们通过链接不同文档中存在的信息片段,为原始文本数据添加了更多的结构。其次,知识图谱使用更好的搜索策略来检索最相关的信息。这提高了LLM的准确性,减少了幻觉发生的机会。

GraphRAG的演变可以比作从最早的网络搜索引擎之一AltaVista到谷歌的过渡。AltaVista仅基于关键字进行网络检索,这很有用,但只是略微有用。当谷歌基于关键字和PageRank检索结果时,它彻底改变了搜索,PageRank考虑了每个网页相对于搜索关键字的重要性和相关性。这基本上就是GraphRAG所做的:遍历信息图,并使用上下文提供最相关、最准确的答案。

用GraphRAG回答高度复杂的问题

GraphRAG可以回答令人难以置信的复杂、抽象的问题,这些问题起初可能与未经训练的眼睛几乎没有联系。以下是一些示例:

问:在希腊神话中,哪两家航空公司是表亲?

答:赫利俄斯和阿特拉斯。

没有一份文件可以回答这个问题,也就是说,在谷歌或书中找不到答案。相反,GraphRAG必须连接不同数据源之间的点来推理答案。它首先确定哪些航空公司以希腊神话中的人物命名,然后检查赫利俄斯和阿特拉斯的家谱,以确认它们之间的关系。

问:微软的销售额对卢旺达的疟疾病例数量有何影响?

答:随着微软销售额的增长,卢旺达的疟疾病例随着时间的推移而减少。

同样,没有具体的文档明确回答这个问题。GraphRAG认为,当微软的销售额增加时,比尔及梅琳达·盖茨基金会会向疟疾研究和治疗投入更多资金,从而减少卢旺达的疟疾病例。

使用GraphRAG克服业务挑战

虽然前面的例子对于说明GraphRAG令人难以置信的推理能力来说非常抽象,但下面的例子说明了企业在提出LLM供应链问题时可能会遇到的一个更合理的情况。

一家家居装修公司担心亚利桑那州的火灾可能会影响他们的运营。他们提出了以下问题:

从亚利桑那州运来的库存低的流行商品是什么?

如果来自亚利桑那州的一些商品缺货,还有哪些其他产品受到影响?

虽然关于这些组件中的每一个的信息(供应商、销售、工具、库存、发货地点等)都存在于某个地方,但这些数据源没有连接,很难手动追踪。因此,要回答这些看似简单的供应链问题,GraphRAG需要找出最准确、最及时的答案,考虑到每个因素及其相互关系。

展望未来:GraphRAG的主要优势和考虑因素

如前所述,GraphRAG的主要优势在于其显著提高LLM准确性和长期推理能力的能力。这一点至关重要,因为更准确的LLM可以自动化日益复杂和微妙的任务,并提供有助于更好决策的见解。

此外,性能更高的LLM可以应用于更广泛的用例,包括那些需要非常高精度的敏感行业,如医疗保健和金融。话虽如此,随着GraphRAG的进步,人工监督是必要的。至关重要的是,该技术产生的每个答案或信息都是可验证的,必要时可以通过图表手动追溯其推理过程。

在当今世界,成功取决于企业理解和正确利用其数据的能力。但大多数组织都沉浸在数十万张数据表中,对实际发生的事情知之甚少。如果不加以解决,这可能会导致决策失误和技术债务。

知识图谱对于帮助企业理解其数据至关重要,当与RAG结合使用时,可能性是无限的。GraphRAG正在推动下一波生成式人工智能,了解这一点的组织将处于创新的前沿。

0 阅读:0