推理成本分析

在大型 AI 服务商的总运营成本中,推理成本通常占到 80–90%,而这笔支出又分成两条截然不同的曲线:一条是按 token 计费的 API 调用成本(OpenAI / Anthropic / DeepSeek / Qwen 等),另一条是按座位 / 用量计费的 Coding Plan 订阅成本(Cursor / GitHub Copilot / Kimi / 智谱龙虾等)。两者定价逻辑、计量口径、限流条款都不同——”每月花多少才不冤”需要分开建模。本目录提供一套”数据驱动 + 脚本自动化”的成本测算框架,避免被首月促销价、5 小时限流窗口、”禁止 API 调用”条款等营销陷阱误导。

1. API 定价定量分析

面向平台方 / 大规模业务方,基于 OpenRouter 聚合定价接口 构建动态、可复现的成本测算链路,替代手工查阅各厂商官网的低效方式。

  • 大模型 API 定价策略定量分析框架:主流模型分级矩阵(OpenAI / Anthropic / Google / DeepSeek / Qwen / Llama)、定价采集机制、缓存命中率与汇率敏感性分析
  • fetch_pricing.py:零依赖(仅 Python 3 标准库)的动态定价测算脚本,支持自定义缓存命中率、输入/输出 token 数、人民币汇率等参数
  • openrouter_models_cache.json:OpenRouter 全量模型报价的本地快照,用于离线复现与历史对比

典型用法:python fetch_pricing.py --hit-rate 0.6 --input-tokens 30.0 --output-tokens 1.0 --exchange-rate 6.9

2. Coding Plan 订阅深度对比

面向开发者 / 中小团队,深度扒清 2026 年 4 月国内外 11 款主流 AI 编程订阅套餐的真实成本,识别”首月七块九”、”5 小时限流”、”禁止 API 调用”等隐藏条款。

配套数据目录:

  • coding_plan/data/pricing_raw/<日期>/:按采集日归档的原始 HTML / 截图 / 文本抽取结果(国内外厂商各自独立子目录)
  • coding_plan/data/pricing_normalized.json:清洗并归一化后的结构化定价数据(驱动报告与图表)
  • coding_plan/data/manual_overrides.json:无法从页面稳定抽取时的人工覆盖值,保证报告可复现

3. 如何选择分析口径

面对一个成本问题,先分清用户画像再决定看哪份文档:

用户画像 核心诉求 主参考文档
平台方 / 大规模业务 百万 token 单价、月账单预算、模型切换 ROI §1 API 定价定量分析
个人开发者 / 中小团队 订阅月费、限流条款、是否支持外接 Agent §2 Coding Plan 深度对比
政企 / 合规敏感 数据出境、私有化交付、审计可观测 §2 Coding Plan 报告 §1.2 选型速查表