检索增强生成与工具生态

本目录专注于检索增强生成(RAG)技术、知识图谱(KG)以及文档智能处理工具的深度探索与实践,旨在构建从非结构化数据处理到高阶推理应用的完整技术栈。


1. 检索增强生成基础与进阶

探索 RAG 系统的核心组件、策略对比与模型选型,构建高效的检索增强生成系统。


2. 图检索增强生成与知识图谱

结合知识图谱增强 RAG 的推理能力,深入 GraphRAG 前沿技术,解决复杂关系推理难题。


3. 大模型与知识图谱协同应用

探索大语言模型(LLM)与知识图谱的深度融合,构建高可信、可解释的智能应用。


4. 文档智能解析

高效处理非结构化文档(PDFOffice 等),为 RAG 系统提供高质量的数据输入,解决“垃圾进,垃圾出”(Garbage In, Garbage Out)问题。

  • mineru 文档解析 - 上海人工智能实验室开源工具,助力复杂 PDF 高效解析
  • marker pdf 布局检测 - 基于深度学习的高精度 PDF 解析与布局分析引擎
  • markitdown 入门 - Microsoft 开源的文档转换工具,支持多种办公文档格式到 Markdown 的高质量转换