RAG 与工具生态

把「让大模型用上领域知识」这件事做好,有两条绕不开的路:RAG(用检索补全 LLM 知识的时效性与专精性)和知识图谱(把结构化关系喂给 LLM 做可控推理)。两条路各自又分出「基础能力」「架构升级」和「数据输入」三层关切——本目录就沿着这条脉络展开:从 chunking / embedding 基本功,到 GraphRAG / KAG 的图驱动推理,再到银行反电诈的 LLM + KG 协同案例;所有这些都建立在高质量的数据输入之上,所以也收录了 MinerU / Marker / MarkItDown 三款 PDF 解析工具的对比与实战。

1. RAG 基础能力

真正决定 RAG 线上效果的是「切、嵌、编排」三件事。详细索引见 rag_basics/README.md

2. GraphRAG 与知识图谱

Naive RAG 在多跳推理、数值/时间约束、领域 Schema 对齐上会失效。图驱动的方案(GraphRAG / KAG)把文档变成结构化知识让 LLM 沿图走。详细索引见 graph_rag/README.mdknowledge_graph/README.md

3. LLM + KG 协同落地案例

以银行反电信网络诈骗为标本,把设计方案与可运行 demo 打通。详细索引见 synergized_llms_kgs/README.md

4. 文档智能解析工具链

「Garbage in, garbage out」——RAG 的质量上限是 PDF 解析的质量。详细对比与选型见 pdf_tools/README.md

5. 相关资源