2026年成AI智能体规模化落地关键一年！“养龙虾、养马”掀起全民热潮去年

2026年成AI智能体规模化落地关键一年！“养龙虾、养马”掀起全民热潮

去年，AI助手MANUS的爆火，让AI智能体开始引发大众关注，但是谁也没想到，一年之后，“养龙虾、养马”让AI智能体开始大规模走入工作生活中。“龙虾”可以自主整理文件、编辑文档；而“马”还会自我进化，每次任务后自己总结、更新方法，能更进一步的深度思考。

AI智能体变得越来越智慧的同时，篓子也没少捅，你让AI助手帮忙整理文件，它把你工作文档删了；让它回复邮件，它把私人信息群发给了全公司，更头疼的是，Agent多轮交互下来Token消耗爆炸式增长，十几轮对话跑下来，成本比请个实习生还高。

原因就在于，Agent不是按固定指令跑的传统程序，它会动态调用工具、自己判断下一步做什么，行为不可预测。用业内的话说："Agent的安全风险跟传统应用不是一个量级，是一个系统性的放大所有漏洞。"而安全问题之外，部署效率和Token成本同样卡着开发者的脖子。

日前，在“鲲鹏昇腾创享月”上，华为鲲鹏技术专家团在《openEuler&openFuyao 共建Agent Infra 底座，打造agent 极速沙箱》的分享中，从安全、极速、降本三个方向给出了Agent落地的解法。

首先，针对AI智能体的安全问题，openEuler的方案是分层沙箱：低风险操作用进程容器隔离，高风险操作用MicroVM强隔离，根据Agent行为意图灵活选择隔离级别，并且通过行为护栏，对Agent进行监控，管控异常动作，如对泄露个人信息、误删等危险操作进行拦截和警告。而且，它还可以实现全链路可观测、数据回滚，迅速恢复被误删的信息。

其次，是启动时间和执行效率方面，openFuyao的极速沙箱专门为Agent场景设计，能实现多任务的并发执行，比如每秒1000并发的高密部署，执行效率上，0.1秒（百毫秒）启动，超快！

最后，是降低Token消耗方面，Agent多轮交互，每次都要加载全部历史上下文，大量重复计算浪费算力。openFuyao的解法是KVC三大技术：KVC内存池化，把NPU算力从重复计算中解放出来，转移到新推理请求上；KVC-Aware细粒度调度，基于KV-Cache数据亲和做token级调度，降低推理延迟；KVC量化压缩，把KV-Cache从FP16压到INT4，更少空间存同样信息，不损伤精度还提升速度。实测智能编程场景KV缓存命中率85%-95%，整体吞吐提升2-3倍。

当前，AI智能体的发展可以说是处于“飞速”阶段，从“养龙虾”的火热到“养马”的火热，只有短短一个多月的时间，Agent跑得快，底座得跟上。安全守住底线、极速扛起并发、降本拉低成本——Agent要规模化落地，Agent Infra先解决这三个根本问题。鲲鹏昇腾创享月鲲鹏昇腾开发者大会2026 鲲鹏超节点

昊梵体育网

2026年成AI智能体规模化落地关键一年！“养龙虾、养马”掀起全民热潮去年

热门分类

2026年成AI智能体规模化落地关键一年！“养龙虾、养马”掀起全民热潮 去年

热门分类

2026年成AI智能体规模化落地关键一年！“养龙虾、养马”掀起全民热潮去年