MCP死没死？ MCP 没死，死的是“工具全塞上下文”的旧玩法 2025 年

2026-05-12 10:43:56 埃隆号科技达人科技

MCP死没死？

MCP 没死，死的是“工具全塞上下文”的旧玩法

2025 年，AI 工程圈吵了大半年：Agent 到底该用 MCP，还是该回到 CLI？

反对 MCP 的人说得很现实：Playwright MCP 一上来吃掉 13.7K tokens，Chrome DevTools MCP 吃掉 18K，5 个 server 还没开始干活，55K tokens 先烧没了。工具 schema 加上工具返回数据，一套流程跑下来，轻松膨胀到 150K tokens。

支持 MCP 的人也没错：CLI 虽然省 token，但没有类型契约，输出经常靠模型猜；遇到多租户应用、不熟悉 API，Agent 还要反复解析文本、试错、修正，稳定性并不高。

但真正的问题不是 MCP，也不是 CLI，而是一个坏习惯：一开局就把所有工具说明、参数、返回格式，全塞进模型上下文。

Anthropic 在 “Code execution with MCP” 里给出的新思路，是把逻辑翻过来：不要让模型背工具，而是让模型写代码，通过 runtime 调工具。

这就是 Code Mode。

旧模式是：工具住在上下文里，模型每一步都背着一大包 schema 跑。

新模式是：工具住在 runtime 里，模型只 import 当前任务需要的模块。用什么加载什么，不用的工具一分钱 token 都不花。

Anthropic 的例子里，Google Drive 会议记录同步到 Salesforce，旧方式约 150K tokens，新方式几行 TypeScript 搞定，只要约 2K tokens，成本直接下降 98.7%。

Cloudflare 更狠，把 2500 个 API endpoint 从 117 万 tokens 压到 1000 tokens，只暴露 search 和 execute 两个函数。

所以，MCP 没死。真正死掉的，是“开局加载所有工具”的粗暴做法。

2026 年做 Agent，核心原则很简单：工具定义属于代码，不属于上下文。

模型负责写几行代码，runtime 负责复杂调用。未来拼的不是谁塞给模型的信息更多，而是谁的运行时更聪明、更省 token、更可控。

一句话总结：AI Agent 的下一阶段，不是模型直接调用一切，而是模型写代码，运行时调用一切。