[CL]《Toward Autonomous Long-Horizon Engineering for ML Research》G Chen, J Chen, L Chen, J Zhao… [Renmin University of China] (2026)
在自主ML研究工程领域,如何让智能体在数十小时的跨阶段任务中保持连贯进展,是一个悬而未决的难题。过去的多智能体系统依赖对话式上下文传递项目状态,本质原因是缺乏一种将"演进中的工程现场"外化为持久结构的协调机制——上下文一旦压缩就失真,失真积累则任务崩溃。
本文的核心洞见是:把智能体间的协调媒介从"对话流"重新看作"文件系统"。由此,File-as-Bus这一关键操作使问题得以解开——论文分析、代码、实验日志作为持久文物沉淀在共享工作区,后续智能体不必重演前序推理,而是直接从当前文物状态重入,实现"薄控制、厚状态"的分层编排。
这项工作真正留下的遗产是:将长周期ML研究工程定性为状态连续性问题而非局部推理问题,并以可复现的实验证实了持久状态设计的决定性权重。它为后来者打开的新门是:以文件系统为协调基底的多智能体架构范式——任何需要跨阶段累积证据的自主任务都可沿此路径延伸。但尚未跨过的门槛是:系统仍依赖固定时间预算与单任务GPU分配,对需要动态资源调度或跨任务迁移经验的场景,其有效性尚待验证。
arxiv.org/abs/2604.13018
机器学习 人工智能 论文 AI创造营



