AI Agent 基础设施——三个决定性层次：工具、数据、编排

原文： https://www.madrona.com/ai-agent-infrastructure-three-layers-tools-data-orchestration/ 2025-2-28 by Jon Turow

想象一家初创公司，20 人的团队能够在不到两年的时间内创造 1 亿美元的年经常性收入（ARR）。这不是未来主义的幻想——这是 AI 驱动增长的现实写照。像 Cursor、Bolt、Lovable 和 Mercor 这样的公司正在打破传统的扩展规则，证明了配备智能 Agent 的精简团队可以颠覆整个行业。

这揭示了初创公司动态的转变。创始人不再受制于人员数量或传统的开发周期。随着 AI Agent 从早期成功转向成为现代软件的基础组成部分，它们正在推动基础设施需求的转变。

这种转变遵循着一个熟悉的模式：随着新应用的出现，它们推动现有基础设施的极限，创造对新能力的需求。反过来，基础设施的进步又释放了更强大的应用，推动下一波创新浪潮。AI Agent 也不例外——它们的快速采用正在重塑软件的构建方式和支持它的基础设施。

对于创始人来说，这带来了巨大的机遇：构建 AI 原生基础设施——涵盖工具、数据和编排——为下一波智能应用提供动力。

在这个新时代，每个创始人都面临着一个关键选择：适应 AI 的变革力量，或者冒着落后的风险。Agent 采用的激增不仅仅是一个趋势——它是对软件如何构建、部署和扩展的根本性重新想象。

AI Agent 基础设施——三层架构：工具、数据、编排

从效率到基础设施：更深层的信号

这不仅仅是关于高效增长——这种转变标志着更深层的东西。随着成功 Agent 应用的清晰模式逐渐显现，创始人们正在急于拥抱和扩展有效的方法。这种 Agent 采用的激增对支持这些应用的基础设施层提出了新的要求。

我们从 2024 年 6 月就开始追踪这种演变，当时我们写了关于《AI Agent 基础设施的崛起》的文章。那时，这个领域还很稀疏，主要由 DIY 解决方案主导，因为开发者优先考虑灵活性来试验不同的方法。有一大批新公司在为 Agent 的未来状态构建基础设施，但这些公司面临着一个移动的目标。

今天，这种情况已经发生了戏剧性的变化。证据无处不在：无服务器 Postgres 提供商 Neon 报告称，AI Agent 现在在其平台上创建数据库的速度是人类开发者的 4 倍以上，这加速了 Neon 的整体指标。

Neon 增长指标

专门的 AI Agent 基础设施组件如 Browserbase 也看到了类似的加速。例如，Browserbase 的 Stagehand UI 自动化库最近突破了每月 50 万次 npm 安装。

Browserbase npm 安装量

这些不仅仅是增长指标——它们是软件构建和部署方式根本性转变的信号。这种转变为 Agent 应用和支持它们的基础设施都带来了机遇。与”当有市场地图时，已经太晚了“的老话相反，我们看到 2025 年成立的公司已经在这个领域获得了显著的牵引力。底层能力和模式发展如此迅速，新进入者可以快速识别和解决新兴需求。

从实验到清晰模式

一年前，Agent 开发的特点是大量的实验。开发者主要从零开始构建，优先考虑灵活性，以便在寻找获胜方法时进行调整。今天，情况发生了戏剧性的变化。多个可重复的模式已经出现，聪明的创始人正在急于拥抱和扩展有效的方法。

这些模式建立在我们 1 月份对 Agent 领域分析（AI agents are stuck in first gear — but 2025 will change that）的基础上，显示了一套通用 Agent 模式正在显现：

下一代 Copilot 是上下文感知的助手，主动协助复杂任务，以 Bolt.new、AirOps 和 Colimit 为代表。
团队成员 Agent，如 Ravenna、Sailplane 和 Basepilot，更进一步，自主推动多步骤工作流程。
Agent 组织 引入协作系统，多个专门的 Agent 协同工作，如 Aaru 的概率模拟。
下一个类别，Agent 即服务，提供专门的 Agent 能力作为面向开发者的服务，而不是面向用户的产品。

所有这些都对基础设施堆栈产生了影响。

基础设施堆栈的出现：三个决定性层次

随着 Agent 模式的固化，AI Agent 基础设施堆栈的三个层次已经成为特别具有决定性的：工具、数据和编排。每个层次都看到激烈的竞争，因为提供商竞相解决与传统 SaaS 基础设施根本不同的 Agent 特定挑战。

（一）工具层：让 Agent 具备能力

工具层经历了最戏剧性的扩展，反映了 Agent 交互日益增长的复杂性。关键战场包括：

浏览器基础设施和 UI 自动化

Agent 越来越需要与可视化网络交互——不仅仅是 API。像 Browserbase、Lightpanda 和 Browserless 这样的公司正在构建使这成为可能的基础设施，而像 Stagehand 这样的专门服务为常见模式提供更高级别的抽象。

身份验证和安全

当 Agent 代表用户行动时，身份验证和安全呈现出新的维度。像 Clerk、Anon 和 Statics.ai 这样的公司正在开创”Agent 身份验证“——以 Agent 原生方式管理权限、凭据和安全。

工具发现和集成

正如 Akash Bajwa 最近评论的，Anthropic 的模型上下文协议（Model Context Protocol，MCP）正在成为潜在的”AI Agent 的 TCP/IP“，为 Agent 发现和与工具交互提供标准化方式，同时保持上下文。像 Stripe、Neo4j 和 Cloudflare 这样的主要参与者已经提供 MCP 服务器，表明这可能成为工具集成的关键标准。

像 Composio 和 Arcade.dev 这样的公司正在这些协议之上构建抽象层。Composio 提供与 Gmail 和 Linear 等流行应用的 MCP 兼容访问，通过 TypeScript 和 Python SDK 为开发者提供标准化接口。同时，Arcade.dev 通过与 OpenAI 规范兼容的统一 API 层简化身份验证和工具管理。

这种多层方法至关重要，因为它解决了不同的开发者需求。基础设施团队可以直接针对 MCP 等协议构建，而应用开发者可以利用 Composio 或 Arcade.dev 等托管解决方案。这些方法不是相互排斥的；相反，它们可以共存并相互补充，最终加速 Agent 驱动应用的采用。

今天，发现 Agent 就绪工具仍然经常依赖口碑传播，感觉很像发现 Discord 服务器的早期阶段。但标准化协议和托管集成层的结合表明我们正在朝着更结构化的发现机制发展。

（二）数据层：大规模内存

数据层说明了传统基础设施必须如何为 Agent 工作负载而演进。Neon 的经验很有启发性。如上所述，AI Agent 现在以人类开发者 4 倍的速度在 Neon 上创建数据库，推动了对即时配置、自动扩展和隔离环境的新要求。

当 Create.xyz 在 Neon 之上推出其开发者 Agent 时，Create 在短短 36 小时内创建了 20,000 个新数据库。最终用户只是描述了他们想要构建的东西——”构建一个使用 AI 对申请进行排名的招聘网站”或”创建一个自动生成 SEO 元数据的内容管理系统”——Agent 就会自动配置必要的数据库基础设施。

这种模式在整个数据层重复出现：

向量数据库 如 Pinecone、Weaviate 和 Qdrant 正在优化 Agent 内存和检索模式
图数据库 如 Neo4j 正在为 Agent 推理和关系映射提供专门的功能
时间序列数据库 正在适应 Agent 活动跟踪和性能监控

关键的区别在于 Agent 如何使用数据。与传统应用不同，Agent 需要：

动态模式演化，因为它们学习和适应
高频读写模式，用于实时决策
复杂的查询模式，结合结构化和非结构化数据

（三）编排层：协调复杂性

编排层可能是最复杂的，因为它必须管理 Agent 行为、工作流程和交互的复杂性。关键组件包括：

工作流程管理

像 Temporal、Inngest 和 Windmill 这样的公司正在适应 Agent 工作流程，这些工作流程可能是长时间运行的、非确定性的，并且需要人工干预。

状态管理

Agent 需要复杂的状态管理，跨越多个交互和上下文。像 Replit 的 Agent 状态管理和 LangGraph 这样的解决方案正在解决这些挑战。

监控和可观察性

Agent 行为比传统软件更难预测和调试。像 LangSmith、Weights & Biases 和 Arize 这样的公司正在构建 Agent 特定的监控和调试工具。

机遇与挑战

这种基础设施演进为创始人创造了巨大的机遇，但也带来了独特的挑战：

机遇

巨大的市场潜力：随着 Agent 采用的加速，对专门基础设施的需求呈指数级增长
差异化的技术要求：Agent 工作负载与传统应用根本不同，创造了新的技术护城河
快速迭代周期：该领域发展如此迅速，新进入者可以快速获得牵引力

挑战

移动的目标：Agent 模式仍在快速演进，使得构建持久的基础设施变得困难
复杂的集成：Agent 需要与多个系统和服务无缝集成
安全和合规性：Agent 代表用户行动引发了新的安全和合规挑战

展望未来

AI Agent 基础设施的演进才刚刚开始。随着模式的固化和需求的明确，我们预期会看到：

标准化的加速：像 MCP 这样的协议将变得更加普遍
专业化的深化：每个层次内的工具将变得更加专门化和强大
集成的简化：更好的抽象将使 Agent 开发变得更加容易

对于创始人来说，现在是进入这个领域的最佳时机。基础设施需求是明确的，市场正在快速增长，技术挑战是真实的但可以解决的。

关键是要专注于解决 Agent 的特定需求，而不是试图适应现有的传统基础设施。那些能够构建真正 Agent 原生解决方案的公司将在这个新时代中蓬勃发展。