检索加强生成(RAG)技术概述
检索加强生成(Retrieval-Augmented Generation,简叫作 RAG)是一种旨在提高大型语言模型(Large Language Models,LLMs)性能的技术办法。其核心思想是经过整合外边靠谱知识库的信息来加强模型的输出质量。
RAG 的工作原理可以概括如下:当 LLM 接收到查找时,它不仅依赖于自己的预训练知识,还会主动从指定的知识源检索关联信息。这种办法保证了生成的输出能够参考海量上下文丰富的数据,并得到最新、最关联可用信息的支持。
RAG 系统的核心组件
标准 RAG 系统重点由三个关键组件形成: 检索器组件(Retriever Component):功能:在知识库或大规模文档集中搜索与查找主题高度关联的信息。工作方式:识别在语义上与查找关联的文档,并经过类似度度量(一般采用向量间的余弦类似度)计算关联性。生成器(Generator):定义:一般是一个大型语言模型。输入:检索到的关联信息和原始查找。输出:基于输入生成响应。知识库(Knowledge Base):用途:做为检索器查询文档或信息的数据源。RAG 的工作流程从外边源收集关联信息。将收集到的信息附加到用户的原始提示中。将加强后的提示做为输入发送给语言模型。在生成周期,LLM 结合加强提示和自己的训练数据暗示,生成针对用户查找定制的响应。这一过程产生的响应融合了个性化和可验证的信息,尤其适用于聊天设备人等应用场景。
图2:检索加强生成流程示意
构建 RAG 系统的关键过程知识库准备:对文档进行索引创建文本嵌入检索器模型:训练或微调,以有效搜索知识库生成器模型:一般采用预训练的语言模型系统集成:保证各组件无缝协作Graph RAG 技术简介
Graph RAG 是 RAG 方法的一个高级变体,其特点是引入了图结构数据。与将知识库视为平面文档集合区别,Graph RAG 将信息暗示为实体和关系的互联网络。
Graph RAG 的核心概念
Graph RAG 基于知识图谱(Knowledge Graphs,KGs)构建。知识图谱是现实世界实体及其关系的结构化暗示,重点由两个基本元素构成: 节点(Nodes): 暗示单个实体,如名人、地点、物体或概念。边(Edges): 暗示节点之间的关系,定义了实体间的连接方式。相比于标准 RAG 运用向量类似度和向量数据库进行检索,Graph RAG 利用知识库进行更全面、系统的信息检索,从而加强了检索的完整性和准确性。
Graph RAG 的技术优良
Graph RAG 相较于标准 RAG 拥有以下明显优良: 关系上下文捉捕:能够捉捕和利用信息片段之间的繁杂关系,供给更丰富、更具语境的信息检索结果。多跳推理能力:图结构支持系统沿关系链进行推理,实现更繁杂、更深入的规律分析。结构化知识暗示:相比平面文档结构,图结构能更自然地暗示层级和非层级关系,更贴近现实世界的知识组织方式。查找效率提高:针对触及关系遍历的查找类型,图结构可明显加强处理效率。
图3:知识图谱示例
Graph RAG 的工作原理
Graph RAG 的工作流程能够概括为以下几个关键过程: 查找处理:对输入查找进行分析和转换,使其适合图结构的查找格式。图遍历:系统在图结构中进行探索,沿关联关系路径寻找连接的信息节点。子图检索:区别于检索独立的信息片段,系统提取包括相互相关上下文的关联子图。信息整合:将检索到的子图进行组合和处理,形成一个连贯、全面的上下文信息集。响应生成:语言模型基于原始查找和整合后的图信息生成最后响应。Graph RAG 处理流程图
图4:Graph RAG 处理流程示意图
标准 RAG 与 Graph RAG 的关键区别知识暗示方式:标准 RAG:采用平面文档结构Graph RAG:运用图结构暗示知识检索机制:标准 RAG:重点依赖向量类似度搜索Graph RAG:采用图遍历算法进行信息检索上下文理解能力:Graph RAG 能够捉捕更繁杂的多过程关系,这些关系在标准 RAG 中可能被忽略推理能力:Graph RAG 的图结构支持对相互相关信息进行更深入、更繁杂的推理
图5:RAG 与 Graph RAG 对比示意
总结
Graph RAG 技术经过引入图结构化的知识暗示和处理办法,明显加强了传统 RAG 系统的能力。它不仅加强了信息检索的准确性和完整性,还为繁杂查找和多步推理供给了更强大的支持。这种办法在处理需要深度上下文理解和繁杂关系分析的任务中,展现出了显著的优良。
随着知识图谱技术和图数据库的持续发展,Graph RAG 有望在各样高级人工智能应用中发挥越来越重要的功效,尤其是在需要精确、全面信息检索和繁杂推理的行业。
作者:Praveen Raj
|