模型训练与微调

开源基座模型只是起点——真正决定它能否在业务里跑起来的，是预训练之后的那一段路：用领域数据做后训练、用 SFT 把能力对齐到具体任务、再用基准评测量化它在目标场景的真实水平。本目录围绕这条链路展开：一侧是运维（AIOps）场景下的后训练方法论与评估/基准生成框架，另一侧是一份可以跑起来的 SFT 实战样例，涵盖从理论到落地的完整闭环。

1. AIOps 后训练与评估（`ai_ops_design`）

这三份文档是一条连续的工程线：先讨论怎么把通用大模型后训练成 AIOps 专家，再回答「训完了到底行不行」，最后解决「评测数据从哪儿来」。完整索引见 ai_ops_design/README.md。

AIOps 后训练技术 — 给出从基座模型选型到后训练全流程的方法论，拆解告警理解、根因推断、工具调用等七项核心能力的训练路径。
Kubernetes AIOps 模型评估框架 — 以「知识验证 / 推理评估 / 场景测试」三位一体为骨架，覆盖控制面、Pod、节点、网络、存储、自动化运维、安全合规 7 个维度的能力指标体系。
Kubernetes AIOps 基准测试生成框架 — 用 GPT-5 / DeepSeek 等模型驱动基准用例的自动生成流水线，把评估标准编码为可复现的 prompt 模板，解决测试集规模化与多样性问题。

2. SFT 实战（`sft_example`）

从「读懂理论」到「跑出一个自己的微调模型」之间隔着一堆工程细节：数据格式、LoRA 配置、显存预算、推理验证。下面的材料把这些细节压在一个可运行的样例里。

SFT 实战指南 — 实战项目的入口页，包含环境、数据、运行步骤与理论速览。
Qwen2 指令微调 Notebook — 基于 Qwen2-1.5B-Instruct + LoRA，用 ModelScope 数据集和 SwanLab 监控跑完一次完整的指令微调。
一文入门垂域模型 SFT 微调 — 以金融「企业年报分析助手」为案例，串起数据构建、基座选型、训练配置、评估与灰度上线的全链路。

模型训练与微调

1. AIOps 后训练与评估（ai_ops_design）

2. SFT 实战（sft_example）

1. AIOps 后训练与评估（`ai_ops_design`）

2. SFT 实战（`sft_example`）