GraphRAG揭秘：构建层次化知识图谱的终极指南-阿里云开发者社区

GraphRAG揭秘：构建层次化知识图谱的终极指南

2024-08-01 1488

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： GraphRAG揭秘：构建层次化知识图谱的终极指南

简介

现在的 RAG 检索增强生成是一种使用真实世界信息改进 LLM 输出的技术。

大多数 RAG 方法使用向量相似性作为搜索技术，叫 Baseline RAG 。

但是 RAG 提取的每个文档是独立的，没有显式的结构化关系。

检索出的文档可能缺乏上下文连接，并且依赖于语言模型的推理能力还有检索出的文档。

GraphRAG 是一种结构化的、分层的检索增强生成 ( RAG ) 方法，不同于使用纯文本片段的简单语义搜索方法。

GraphRAG 流程包括从原始文本中提取知识图谱、构建社区层次结构、为这些社区生成摘要，然后在执行基于 RAG 的任务时利用这些结构。

微软在在这种情况下推出了 GraphRAG ，它通过将知识表示为图结构，捕捉更复杂的知识结构和关系，通过这种图结构，可以更容易地获取相关实体的上下文信息。

这样的图结构提供了更直观的知识表示，有助于理解模型的推理过程。也大幅提高了模型的推理问答性能。

一、环境安装

GraphRAG 依赖的 python 版本在 3.10-3.12 之间，执行下列命令：

pip install graphrag

下载一个语料数据集，https://www.gutenberg.org/cache/epub/24022/pg24022.txt 。

根目录新建 /ragtest/input 空文件，然后把下载好的语料文件放入 input 下面。

二、graphRAG 使用

第一步先完成 GraphRAG 初始化：

python -m graphrag.index --init --root ./ragtest

执行成功，可以看到我们的 ragtest 目录下面是这样，

这里面的 .env 里面是 GraphRAG 管道所需的环境变量。

主要是 GRAPHRAG_API_KEY=<API_KEY> 这是 OpenAI API 或 Azure OpenAI 端点的 API 密钥。

用我们自己的 API 密钥。

settings.yaml 包含流程的设置。你可以修改此文件以更改流程的设置。

这里的llm如果是 openai_chat，最好是设置成 gpt-4o-mini ，这一步为了减少我们的成本。现在初始化工作完全准备了，开始执行索引建立：

python -m graphrag.index --root ./ragtest

下面是我们终端的输出，当然这一步时间要长一点，取决于你文档的大小，

可以看到正在提取我们文档里面的数据集还有段落。最后出现 All workflows completed successfully. 说明就成功了。然后打开我们的 output 下面的图谱文件。

图谱至此建立完毕，我们来做一个查询：

python -m graphrag.query \ --root ./ragtest \ --method global \ "What are the top themes in this story?"

得到下面输出：

可以发现问题的答案非常贴近整部书籍。

GraphRAG 在回答上述问题时显示出显著的改进，展示了比以前应用于私有数据集的方法更高的智能的掌握能力。

三、总结

上面就是使用 GraphRAG基本流程，完成的步骤主要就是提取+嵌入，跟之前的rag很类似，GraphRAG 结合了知识图谱和 RAG 。

它的目的在于解决传统 RAG 的一些问题，提供更高质量的检索，同时它的出现也改变了企业私有数据分析的技术。

下一节我们将讲述怎么在项目里使用向量数据neo4j ，还有 langchain 工具和 GraphRAG 结合起来。

GraphRAG揭秘：构建层次化知识图谱的终极指南

简介

一、环境安装

二、graphRAG 使用

三、总结

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

GraphRAG揭秘：构建层次化知识图谱的终极指南

简介

一、环境安装

二、graphRAG 使用

三、总结

热门文章

最新文章

相关电子书