昊梵体育网

2026年成AI智能体规模化落地关键一年!“养龙虾、养马”掀起全民热潮 去年

2026年成AI智能体规模化落地关键一年!“养龙虾、养马”掀起全民热潮

去年,AI助手MANUS的爆火,让AI智能体开始引发大众关注,但是谁也没想到,一年之后,“养龙虾、养马”让AI智能体开始大规模走入工作生活中。“龙虾”可以自主整理文件、编辑文档;而“马”还会自我进化,每次任务后自己总结、更新方法,能更进一步的深度思考。

AI智能体变得越来越智慧的同时,篓子也没少捅,你让AI助手帮忙整理文件,它把你工作文档删了;让它回复邮件,它把私人信息群发给了全公司,更头疼的是,Agent多轮交互下来Token消耗爆炸式增长,十几轮对话跑下来,成本比请个实习生还高。

原因就在于,Agent不是按固定指令跑的传统程序,它会动态调用工具、自己判断下一步做什么,行为不可预测。用业内的话说:"Agent的安全风险跟传统应用不是一个量级,是一个系统性的放大所有漏洞。"而安全问题之外,部署效率和Token成本同样卡着开发者的脖子。

日前,在“鲲鹏昇腾创享月”上,华为鲲鹏技术专家团在《openEuler&openFuyao 共建Agent Infra 底座,打造agent 极速沙箱》的分享中,从安全、极速、降本三个方向给出了Agent落地的解法。

首先,针对AI智能体的安全问题,openEuler的方案是分层沙箱:低风险操作用进程容器隔离,高风险操作用MicroVM强隔离,根据Agent行为意图灵活选择隔离级别,并且通过行为护栏,对Agent进行监控,管控异常动作,如对泄露个人信息、误删等危险操作进行拦截和警告。而且,它还可以实现全链路可观测、数据回滚,迅速恢复被误删的信息。

其次,是启动时间和执行效率方面,openFuyao的极速沙箱专门为Agent场景设计,能实现多任务的并发执行,比如每秒1000并发的高密部署,执行效率上,0.1秒(百毫秒)启动,超快!

最后,是降低Token消耗方面,Agent多轮交互,每次都要加载全部历史上下文,大量重复计算浪费算力。openFuyao的解法是KVC三大技术:KVC内存池化,把NPU算力从重复计算中解放出来,转移到新推理请求上;KVC-Aware细粒度调度,基于KV-Cache数据亲和做token级调度,降低推理延迟;KVC量化压缩,把KV-Cache从FP16压到INT4,更少空间存同样信息,不损伤精度还提升速度。实测智能编程场景KV缓存命中率85%-95%,整体吞吐提升2-3倍。

当前,AI智能体的发展可以说是处于“飞速”阶段,从“养龙虾”的火热到“养马”的火热,只有短短一个多月的时间,Agent跑得快,底座得跟上。安全守住底线、极速扛起并发、降本拉低成本——Agent要规模化落地,Agent Infra先解决这三个根本问题。鲲鹏昇腾创享月 鲲鹏昇腾开发者大会2026 鲲鹏超节点