下面是对 The New Stack 文章“The reason big tech is giving away AI agent frameworks” 的总结与分析(2026-02-20 发布):(LinkedIn)
📌 核心观点与背景
本文作者把当前 AI 代理(agent)框架竞争 比作 十年前的容器编排之争(Container Orchestration Wars)。当时多个容器调度/管理系统竞争(如 Docker Swarm、Mesos、Nomad),最终由 Kubernetes 凭借社区与生态赢得胜利,而不是纯技术特点。现在 AI 代理框架的竞争模式有很多相似性。(LinkedIn)
🧠 1. 为什么大厂免费提供代理框架?
“免费框架 + 付费运行时”是主要策略
- AWS、Google、Microsoft、OpenAI 等大厂发布的框架(如 AWS Strands、Google ADK、Microsoft Agent Framework、OpenAI Agents SDK)基本都是 开源或免费的。
- 真正的营收点是 付费的推理、部署环境和运行时服务,例如 AWS 的 Bedrock AgentCore、Google 的 Vertex AI、Microsoft Foundry。
- 换句话说,框架是引力(on-ramp),运行时和基础设施才是商业货币化的地方:这与过去容器编排工具免费、底层云负载计费类似。(LinkedIn)
🧩 2. 与容器编排战争的类比与区别
相似点
- 不同框架功能上各有优点,如 LangGraph、CrewAI、Mastra、PydanticAI 等都有自己的技术特色。
- 框架“输赢”更多受生态、社区支持、底层平台绑定而非纯技术优越性影响。
- 最终赢家可能不是单一框架,而是能形成大量生态与标准的工具层。(LinkedIn)
关键区别
- 容器是均质的抽象(一个容器在不同平台上是可移植的),因此最终出现了单一标准(Kubernetes)。
- AI 代理应用差异巨大:例如写代码的 agent、客服 agent、数据分析 agent 对运行时需求和工具集完全不同,这意味着不存在一个“适合所有 agent 的通用框架”。文章认为代理框架可能永远无法像 Kubernetes 那样统一。(LinkedIn)
🔎 3. 文章提出的关键趋势
(一)框架层正在变薄
- 随着大语言模型(LLMs)能力提升,它们本身开始承担规划、工具调用等“原本由框架负责”的任务。
- 更智能的模型意味着 更少依赖复杂的框架逻辑,这是过去容器调度与自组织不同的地方。(LinkedIn)
(二)真正有价值的四个领域
文章认为,随着框架本身不断被下沉,真正工程价值落在以下四个层面:
上下文工程(Context Engineering) 有效管理和组织模型“看到”的状态和信息比控制流更重要。文章提到 Google ADK 在这方面做得很深入。(LinkedIn)
评估与可观测性(Evaluation & Observability) 衡量和监控 agent 行为成为生产级应用必需,框架本身的比较表并不能解决。(LinkedIn)
代理安全(Agent Security) 安全性成为刚需,例如代理身份管理、权限分离与审计等。这个层面是跨框架的。(LinkedIn)
互操作协议(Interoperability Protocols) MCP(通用工具协议)和 A2A(agent-to-agent 通信)等协议有可能成为更基础的行业标准,使具体框架变成可替换的“插件”。(LinkedIn)
🧠 4. 文章结论与建议
- 框架本身可能 不是赢家,未来竞争更多围绕 协议、生态和运行时标准。
- 对平台工程团队的建议是:“押注协议而不是单一框架”,并在设计时优先支持通用协议(如 MCP、A2A)以及跨框架的评估与监控体系。
- 如果深度绑定某个云服务,使用其同构框架与运行时能获得工程优势;但要注意避免锁定。(LinkedIn)
📊 核心结论(简明总结)
| 主题 | 结论 |
|---|---|
| 框架为什么免费 | 大厂通过免费开源框架带动付费运行时生态 |
| 框架竞争本质 | 类似“容器编排大战”,但 agent 更异质 |
| 真正价值层 | 上下文管理、评估可观测性、安全、协议标准 |
| 工程建议 | 押注协议与可观测层,而非绑框架 |
如需,我可以进一步把这篇文章拆解成技术路线建议(例如企业选择 agent 堆栈的流程、对比 AWS/Google/OpenAI 生态的工程实践等)。
这篇文章如果读着“有点悬”,通常是因为它默认你已经熟悉三块背景:
- 容器编排大战(2014–2018)
- 什么是 Agent Framework
- 云厂商的商业模式
我给你系统补齐一遍。
一、为什么作者拿“容器战争”做类比?
1️⃣ 先理解什么是容器
容器技术核心代表是:
- Docker
Docker 解决了一个核心问题:
“程序在我电脑上能跑,为什么到服务器就不行?”
容器把应用 + 依赖打包成标准化单元。
2️⃣ 但容器只是第一步
当公司有 1000 个容器时,问题变成:
- 谁调度?
- 谁重启?
- 谁扩缩容?
- 谁做滚动发布?
于是出现了容器编排系统:
- Kubernetes
- Docker Swarm
- Apache Mesos
- Nomad
当时大家在争:
“到底哪个才是未来标准?”
最终 Kubernetes 赢了。
但关键点是:
👉 它赢不是因为“技术碾压”,而是:
- 社区最大
- 云厂商支持
- 生态最丰富
- 成为事实标准
二、现在 AI Agent 领域在发生什么?
1️⃣ 什么是 Agent?
Agent ≠ Chatbot
Agent = 能:
- 规划
- 调用工具
- 记忆状态
- 多步骤执行任务
- 和其他 Agent 协作
比如:
- 写代码
- 自动做财务分析
- 自动修复 PR
- 自动化客服系统
2️⃣ 什么是 Agent Framework?
Agent Framework 是:
“帮你构建 Agent 的工程工具层”
类似当年 Kubernetes 对容器的作用。
现在市面上有很多:
- LangGraph
- CrewAI
- PydanticAI
- Mastra
- OpenAI Agents SDK
- Google Agent Development Kit
问题来了:
会不会出现一个 “Agent 版 Kubernetes”?
这就是文章的核心悬念。
三、为什么大厂要“免费送框架”?
这里是文章真正的逻辑核心。
你要理解云厂商商业模式。
1️⃣ 云厂商真正赚钱的是什么?
不是框架。
而是:
- 计算
- GPU
- 推理调用
- 运行时托管
- API 请求
举例:
Amazon Web Services
Amazon Bedrock
Google Cloud
Vertex AI
Microsoft
Azure AI Foundry
框架免费。
但你部署后:
👉 推理算力在他们云上 👉 数据在他们云上 👉 Agent runtime 在他们环境里
这才是收入。
2️⃣ 为什么这和容器战争像?
当年:
- Kubernetes 是免费
- 但 EKS / GKE / AKS 是收费
现在:
- Agent SDK 免费
- 但 Agent Runtime 收费
这就是文章的类比。
四、但作者说:这次不会出现“统一标准”
这是关键区别。
容器是“均质的”。
一个 Web 服务容器和另一个容器,本质类似。
但 Agent 不是。
写代码的 Agent 和客服 Agent 和自动驾驶调度 Agent
结构完全不同。
作者认为:
Agent 的“异质性”太高,不可能像 Kubernetes 那样统一。
五、为什么框架会“变薄”?
这是一个很重要的趋势。
以前:
- 需要框架帮你写复杂控制流
- 需要框架调度工具
- 需要框架管理多步骤逻辑
现在模型越来越强。
比如:
- OpenAI 的 GPT-4.1+
- Anthropic 的 Claude 系列
- Google DeepMind 的 Gemini
模型本身:
- 会规划
- 会分解任务
- 会工具调用
- 会自反思
框架变成“薄封装”。
这和 Kubernetes 那种“不可替代的控制平面”不同。
六、文章真正想说的是什么?
不是“哪个框架会赢”。
而是:
未来真正有价值的不是框架,而是:
- Context Engineering(上下文管理)
- Evaluation(评估体系)
- Observability(可观测性)
- Security(Agent 安全)
- Interop Protocol(协议标准)
类似互联网早期:
HTTP 赢了 不是因为某个 Web 框架赢了。
七、用一句话解释整篇文章
Agent Framework 之争,不是技术之争,而是生态和运行时之争;最终赢家可能是协议层,而不是框架本身。
八、结合你自己的工程背景
你现在在做:
- Agent skills
- DevOps 自动判断 PR
- LLM 驱动回流判断
- 多分支分析
这篇文章对你的真正启发是:
👉 不要把系统设计绑定死在某个 Agent 框架上 👉 优先抽象出协议层、技能接口层 👉 把评估与日志体系做成独立模块
这样你未来可以:
- 换模型
- 换框架
- 换运行时
- 甚至换云
但核心能力不丢。
如果你愿意,我可以:
- 画一张「Agent 技术栈分层图」
- 或者帮你做一个“面向工程落地”的解读版本
- 或者专门结合你在构建个人知识库系统的场景分析
你想往哪个方向深入?
好,这个我们直接画一个工程可落地版本的 Agent 技术栈分层,而不是营销版架构图。
我给你一个「从底到顶」的 8 层结构,并解释每层真正负责什么。
🧱 Agent 技术栈分层图
┌──────────────────────────────┐
│ 8. 应用层 (Application Layer) │
│ 具体业务:自动PR审查 / 知识库助手 / 财务分析Agent │
└──────────────────────────────┘
▲
┌──────────────────────────────┐
│ 7. 编排层 (Orchestration Layer) │
│ 多Agent协作 / 工作流 / 状态机 / DAG │
│ 例: LangGraph / CrewAI / 自定义Flow │
└──────────────────────────────┘
▲
┌──────────────────────────────┐
│ 6. Agent抽象层 (Agent Runtime) │
│ 记忆管理 / 工具调用 / 任务规划 / ReAct循环 │
│ OpenAI Agents SDK / ADK 等 │
└──────────────────────────────┘
▲
┌──────────────────────────────┐
│ 5. 工具层 (Tooling Layer) │
│ 搜索 / 数据库访问 / Git API / 浏览器 / 执行器 │
│ MCP / Function Calling / A2A │
└──────────────────────────────┘
▲
┌──────────────────────────────┐
│ 4. 上下文工程层 (Context Engineering) │
│ Prompt构建 / RAG / Memory压缩 / Token预算 │
└──────────────────────────────┘
▲
┌──────────────────────────────┐
│ 3. 模型抽象层 (Model Interface) │
│ LLM调用统一接口 / 多模型路由 / fallback │
│ OpenAI / Anthropic / Gemini │
└──────────────────────────────┘
▲
┌──────────────────────────────┐
│ 2. 推理与计算层 (Inference Layer) │
│ API调用 / 本地推理 / GPU / 并发控制 │
│ Bedrock / Vertex AI / Ollama │
└──────────────────────────────┘
▲
┌──────────────────────────────┐
│ 1. 基础设施层 (Infrastructure) │
│ 云平台 / 容器 / Kubernetes / 网络 │
└──────────────────────────────┘
🔎 每一层到底解决什么问题?
我们一层一层讲清楚。
1️⃣ 基础设施层
这里是:
- Kubernetes
- Amazon Web Services
- Google Cloud
它解决:
程序怎么部署?怎么扩缩容?怎么稳定运行?
这一层和 Agent 无关,是传统 DevOps。
2️⃣ 推理与计算层
这里才开始和 AI 直接相关。
例如:
- Amazon Bedrock
- Vertex AI
- Ollama
这一层解决:
- 模型怎么被调用?
- 并发怎么控制?
- 费用怎么计量?
👉 云厂商真正赚钱在这里。
3️⃣ 模型抽象层
这是一个非常关键的工程层。
它解决:
- 多模型切换
- 模型 fallback
- 成本路由
- 统一接口
例如:
- OpenAI
- Anthropic
- Google DeepMind
如果你不做这一层,你就被锁死。
4️⃣ 上下文工程层(真正核心)
这一层是 2026 年真正的竞争点。
包括:
- RAG 检索
- 长上下文管理
- memory 压缩
- token 预算
- 状态快照
很多人忽略这一层。
但实际生产中:
80% 的 agent 故障都来自上下文混乱。
5️⃣ 工具层
Agent 的能力来源。
包括:
- Git API
- 数据库查询
- 浏览器
- 文件系统
- 内部微服务
标准趋势:
- MCP(Model Context Protocol)
- A2A(Agent to Agent)
这层未来可能成为“HTTP级标准”。
6️⃣ Agent Runtime 层
这里是:
- ReAct循环
- 工具选择逻辑
- 记忆读写
- 错误恢复
- 计划执行
比如:
- OpenAI Agents SDK
- Google Agent Development Kit
- LangGraph
文章争论的“Agent Framework战争”就在这一层。
7️⃣ 编排层
多 Agent 协作。
- DAG
- 状态机
- 任务分发
- 子 Agent
例如:
- CrewAI
企业级系统一定会有这一层。
8️⃣ 应用层
真正业务:
- PR 自动回流判定
- 知识库总结
- 内部客服机器人
- 财务报表自动分析
这一层才产生价值。
🎯 关键洞察
文章的观点可以转成一句架构建议:
不要把架构重心放在第 6 层(Framework层) 要把可控能力放在第 4、5、3 层
因为:
- 框架可以换
- 模型可以换
- 云可以换
但:
- 上下文管理能力
- 工具协议能力
- 评估体系
是你的护城河。
🔥 如果结合你现在的工程方向
你做:
- PR 智能判定
- Agent skills
- DevOps自动分析
你应该重点强化:
- 模型抽象层
- Context工程层
- 工具协议层
而不是押注某个 Agent Framework。
如果你愿意,我可以:
- 画一张“企业级 Agent 架构落地版”
- 画一张“轻量个人知识库 Agent 架构”
- 或者给你一个“未来3年 Agent 技术演进预测图”
选一个方向,我们继续深挖。
我逐步针对个人构建一个: 轻量个人知识库 Agent 架构

评论