昊梵体育网

MCP死没死? MCP 没死,死的是“工具全塞上下文”的旧玩法 2025 年

MCP死没死?

MCP 没死,死的是“工具全塞上下文”的旧玩法

2025 年,AI 工程圈吵了大半年:Agent 到底该用 MCP,还是该回到 CLI?

反对 MCP 的人说得很现实:Playwright MCP 一上来吃掉 13.7K tokens,Chrome DevTools MCP 吃掉 18K,5 个 server 还没开始干活,55K tokens 先烧没了。工具 schema 加上工具返回数据,一套流程跑下来,轻松膨胀到 150K tokens。

支持 MCP 的人也没错:CLI 虽然省 token,但没有类型契约,输出经常靠模型猜;遇到多租户应用、不熟悉 API,Agent 还要反复解析文本、试错、修正,稳定性并不高。

但真正的问题不是 MCP,也不是 CLI,而是一个坏习惯:一开局就把所有工具说明、参数、返回格式,全塞进模型上下文。

Anthropic 在 “Code execution with MCP” 里给出的新思路,是把逻辑翻过来:不要让模型背工具,而是让模型写代码,通过 runtime 调工具。

这就是 Code Mode。

旧模式是:工具住在上下文里,模型每一步都背着一大包 schema 跑。

新模式是:工具住在 runtime 里,模型只 import 当前任务需要的模块。用什么加载什么,不用的工具一分钱 token 都不花。

Anthropic 的例子里,Google Drive 会议记录同步到 Salesforce,旧方式约 150K tokens,新方式几行 TypeScript 搞定,只要约 2K tokens,成本直接下降 98.7%。

Cloudflare 更狠,把 2500 个 API endpoint 从 117 万 tokens 压到 1000 tokens,只暴露 search 和 execute 两个函数。

所以,MCP 没死。真正死掉的,是“开局加载所有工具”的粗暴做法。

2026 年做 Agent,核心原则很简单:工具定义属于代码,不属于上下文。

模型负责写几行代码,runtime 负责复杂调用。未来拼的不是谁塞给模型的信息更多,而是谁的运行时更聪明、更省 token、更可控。

一句话总结:AI Agent 的下一阶段,不是模型直接调用一切,而是模型写代码,运行时调用一切。