LLM 理论与基础

用好大语言模型,前提是先理解它是怎么工作的:文本是如何被切成 token 的、语义是如何被压成向量的、推理能力从哪里涌现、幻觉又从哪里漏出来。本目录把这些底层概念集中到一处,同时向上延伸到两类应用:一类是把 LLM 组装成自动化深度研究智能体(Deep Research),另一类是用 Dify / n8n / Coze 等编排平台把模型能力装进业务流水线。

1. 内容概览

1.1 LLM 基础概念

围绕 Token、Embedding、注意力之外的「结构性」技术组成基础能力地图,详见 llm_basic_concepts/

  • 思维链 (CoT) — 通过显式推理步骤提升复杂问题求解能力,是多跳推理与工具调用的前置条件。
  • 嵌入 (Embedding) — 从 Bag-of-Words / TF-IDF 到 Transformer 句向量的演进,覆盖距离度量、降维可视化与 RAG/聚类/分类等下游用法。
  • 混合专家 (MoE) — 稀疏激活架构如何在不线性放大推理成本的前提下扩展参数规模。
  • 模型量化 (Quantization) — FP16/INT8/INT4 等精度压缩路径,用于降低显存占用与推理延迟。
  • Token 机制 — BPE / WordPiece 的切分逻辑、长度估算工具与成本控制实践。
  • 幻觉 (Hallucination) — 幻觉的成因分层与检索/约束/校验三类缓解策略。
  • 模型文件格式 — GGUF / GGML / Safetensors 的存储结构与互转注意事项。
  • 意图检测 — 基于 LLM 的意图识别管线与常见工程陷阱。

1.2 深度研究(Deep Research)

当「回答」演变成「写一份带引用的研究报告」时,需要搜索 / 阅读 / 规划 / 写作多能力协同。本节收录业界产品解读与落地案例,详见 deep_research/

1.3 工作流编排与应用平台

把 LLM 从 Playground 搬到业务系统,中间还隔着工作流、权限、插件、可观测等一整套工程工作。本节聚焦编排平台选型与落地,详见 workflow/

2. 学习路径建议

  1. 筑基 — 从 llm_basic_concepts 进入,先打通 Token → Embedding → CoT 三条主线,建立「模型怎么看文本、怎么推理」的底层直觉。
  2. 进阶 — 转向 MoEQuantization,理解现代大模型如何在规模与成本两头取舍。
  3. 应用 — 借助 workflow 下的开源编排平台(Dify / n8n / Coze)把模型能力装进自动化流程。
  4. 前沿 — 进入 deep_research,研究当下最复杂的 Agent 应用形态——多能力协同的自动化研究系统。

3. 相关资源

本目录聚焦理论与应用层编排;如需更底层的工程实践,参考: