RAG 基础

把 RAG 从「给 LLM 拼个向量库」做到「线上稳定跑」，真正决定效果的是三件事：切得好不好（chunking 策略）、向量选得准不准（embedding 模型）、编排够不够灵活（从 Naive RAG 到 Agentic RAG 的架构演进）。本目录围绕这三条主线组织文档，既包含理论与评测方法，也包含可上手的 notebook。

1. 核心文档

1.1 架构演进与对比

RAG 策略对比 — 系统梳理多类 Agentic RAG 架构（单智能体路由器、多智能体系统、分层 RAG、Corrective RAG、Adaptive RAG、GraphRAG、Agent-G、GeAR、Agentic Document Workflow 等），分别给出核心思想、优势、挑战与典型应用场景，用于在项目启动阶段做架构选型。

1.2 分块策略评估

Chunking 策略评估总结 — 基于 Chroma 研究团队的 Evaluating Chunking Strategies for Retrieval 报告，提出 token 级精确率 / 召回率 / IoU 三指标取代传统 nDCG@K / MAP@K，用于量化不同 chunker（固定长度、递归、语义、HyDE、聚类）在真实检索中的 token 冗余与召回完整性。

1.3 中文 Embedding 模型选型

中文 RAG Embedding 模型选型 — 面向中文业务的完整选型文档：覆盖 BGE、GTE、M3E、Conan、Piccolo 等主流模型的 MTEB-zh 分数、维度与显存、推理吞吐、开源许可；结合检索准确率、部署成本、维护便利性给出分场景推荐。

2. 动手实验

rag_lesson2.ipynb — 配套 notebook，覆盖文档加载、chunking、embedding、向量库写入与检索问答的端到端流程，可直接在本地 Jupyter 跑通。

3. 相关资源

GraphRAG 与知识图谱 — 当 Naive RAG 在多跳推理上失效时的升级路径。
文档智能解析工具 — 从 PDF / Office 提取高质量 RAG 输入。
LLM 理论与基础 · Embedding — Embedding 技术的理论背景。