推理成本分析
在大型 AI 服务商的总运营成本中,推理成本通常占到 80–90%,而这笔支出又分成两条截然不同的曲线:一条是按 token 计费的 API 调用成本(OpenAI / Anthropic / DeepSeek / Qwen 等),另一条是按座位 / 用量计费的 Coding Plan 订阅成本(Cursor / GitHub Copilot / Kimi / 智谱龙虾等)。两者定价逻辑、计量口径、限流条款都不同——”每月花多少才不冤”需要分开建模。本目录提供一套”数据驱动 + 脚本自动化”的成本测算框架,避免被首月促销价、5 小时限流窗口、”禁止 API 调用”条款等营销陷阱误导。
1. API 定价定量分析
面向平台方 / 大规模业务方,基于 OpenRouter 聚合定价接口 构建动态、可复现的成本测算链路,替代手工查阅各厂商官网的低效方式。
- 大模型 API 定价策略定量分析框架:主流模型分级矩阵(OpenAI / Anthropic / Google / DeepSeek / Qwen / Llama)、定价采集机制、缓存命中率与汇率敏感性分析
fetch_pricing.py:零依赖(仅 Python 3 标准库)的动态定价测算脚本,支持自定义缓存命中率、输入/输出 token 数、人民币汇率等参数openrouter_models_cache.json:OpenRouter 全量模型报价的本地快照,用于离线复现与历史对比
典型用法:
python fetch_pricing.py --hit-rate 0.6 --input-tokens 30.0 --output-tokens 1.0 --exchange-rate 6.9
2. Coding Plan 订阅深度对比
面向开发者 / 中小团队,深度扒清 2026 年 4 月国内外 11 款主流 AI 编程订阅套餐的真实成本,识别”首月七块九”、”5 小时限流”、”禁止 API 调用”等隐藏条款。
- Coding Plan 深度对比与避坑指南:2026 年国内外 11 款主流 AI 编程工具(Cursor / GitHub Copilot / Windsurf / Kimi / 腾讯云 Lite / 智谱龙虾等)的价格、限流、协议红线对比,附角色-场景选型速查表与三条避坑准则
- Coding Plan 数据看板:归一化后的厂商定价源数据,以结构化表格 + 分组柱状图呈现费用阶梯与用量限制,作为纯数据附录
scripts/fetch_coding_plan_pricing.py:定价页面自动化采集脚本(HTML 抓取 + 结构化抽取,支持快照保存)scripts/generate_objective_comparison.py:从归一化 JSON 生成对比报告与图表的渲染工具
配套数据目录:
coding_plan/data/pricing_raw/<日期>/:按采集日归档的原始 HTML / 截图 / 文本抽取结果(国内外厂商各自独立子目录)coding_plan/data/pricing_normalized.json:清洗并归一化后的结构化定价数据(驱动报告与图表)coding_plan/data/manual_overrides.json:无法从页面稳定抽取时的人工覆盖值,保证报告可复现
3. 如何选择分析口径
面对一个成本问题,先分清用户画像再决定看哪份文档:
| 用户画像 | 核心诉求 | 主参考文档 |
|---|---|---|
| 平台方 / 大规模业务 | 百万 token 单价、月账单预算、模型切换 ROI | §1 API 定价定量分析 |
| 个人开发者 / 中小团队 | 订阅月费、限流条款、是否支持外接 Agent | §2 Coding Plan 深度对比 |
| 政企 / 合规敏感 | 数据出境、私有化交付、审计可观测 | §2 Coding Plan 报告 §1.2 选型速查表 |