WisPaper
WisPaper
Scholar Search
Scholar QA
Pricing
TrueCite
[arXiv 2026] AutoAgent:进化认知与弹性内存,通往自进化智能体的必由之路
Summary
Problem
Method
Results
Takeaways
Abstract

本文提出了 AutoAgent,这是一个具备自我演进能力的自适应多智能体框架。该框架通过进化认知(Evolving Cognition)、上下文决策(Contextual Decision-Making)和弹性存储编排(Elastic Memory Orchestration)三大核心组件,实现了在不依赖外部重训的情况下,通过经验积累自主提升智能体的任务成功率与协调效率。

TL;DR

传统的 AI 智能体(Agents)往往是“静态”的,它们依赖于人类预定义的工具描述和固定的工作流模板。AutoAgent 打破了这一僵局,它赋予了智能体类似于人类的“经验反思”能力。通过将认知建模为可演化的状态,结合能够动态伸缩的内存编排,AutoAgent 在没有外部微调的情况下,在 GAIA 等复杂任务上实现了大幅的性能飞跃。

背景定位:从“执行器”到“学习者”的转变

在目前的学术界坐标系中,AutoAgent 处于从**规则导向(Prompt-based)演化导向(Evolution-based)**智能体过度的前沿。它不仅关注如何利用 LLM 解决当前任务,更关注如何让智能体在解决任务的过程中“变得更聪明”。

痛点深挖:为什么现在的 Agent 容易“翻车”?

  1. 认知的偏见与滞后:开发者写的 API 文档可能不完整,或者环境发生变化,智能体却依然死板地遵循过时的提示词。
  2. 内存的“肥胖症”:随着对话步数增加,上下文窗口被大量重复的 Raw Text 塞满,导致 LLM 无法抓住核心决策证据。
  3. 计划的脆弱性:预定义的工作流在遇到第一个非预期错误时往往会直接崩溃。

核心方法论:AutoAgent 的三大支柱

1. 进化认知 (Evolving Cognition)

AutoAgent 将认知分为**内部(Internal)外部(External)**两部分。

  • 内部认知:智能体对自身拥有的工具和技能的“实战感悟”。
  • 外部认知:对协作伙伴(Peer Agents)能力的动态评估。 最重要的改进是,这些认知不是硬编码的,而是基于执行轨迹通过 LLM Retriever 反思并更新的 Markdown 状态。

模型架构图 图 1:AutoAgent 的闭环演化架构。实线表示实时执行循环,虚线表示长期的自我进化循环。

2. 弹性内存编排 (Elastic Memory Orchestration, EMO)

为了解决 Context 爆炸问题,EMO 模块实现了一种 “多粒度取舍” 机制:

  • Raw Data:保留完整的执行证据。
  • Abstracts:对冗余步进行压缩。
  • Episodic Memory:将多步操作抽象为高阶的“经验片断”。 智能体会根据当前决策的需要,动态地从内存池中决定:“这一轮我需要看细节(Raw),还是只看个大概(Abstract)?”

内存编排流程 图 2:EMO 模块的运作逻辑,通过 Selector 动态决定历史信息的呈现形式。

3. 自我演进 (Self-Evolution)

这是 AutoAgent 的“灵魂”。通过 Intention-Outcome Alignment(意图-结果对齐),智能体会分析:“我原本想干嘛?结果发生了什么?为什么会这样?”

  • 如果工具调用失败:更新工具的 Preconditions。
  • 如果发现一个连招有效:将其打包成 Composite Action(复合动作/新技能) 存入技能库。

实验与结果:全线 SOTA

AutoAgent 在一系列极具挑战性的 Benchmark(如 GAIA, ALFWorld)上进行了测试。

  • 性能压制:在 Gemini-3-Pro 为内核时,AutoAgent 在 GAIA 全维度任务上均大幅领先 DeepAgent。
  • 适应不稳定性:在消融实验中,即使故意给智能体一个 50% 失败率的“烂工具”,AutoAgent 也能通过几次演化,快速识别并调整策略,F1 指标提升超过 10%。

实验结果对比 表 1:闭源模型背板下的性能对比,AutoAgent 在复杂任务(GAIA/HLE)中表现优异。

深度洞察与总结

AutoAgent 展示了一个深刻的洞见:智能体的认知应当是分布在 Prompt 和 Memory 中的一种动态平衡。

局限性

  • 计算成本:自我演化循环需要额外的 LLM 调用来分析轨迹,这在短期内增加了推理成本。
  • 收敛性:在大规模 Agent 社会中,去中心化的认知更新如何避免“相互误解”仍需深入研究。

未来展望

AutoAgent 为我们描绘了这样一个未来:你可以部署一个“零基础”的智能体,让它在实际工作中通过跌跌撞撞的尝试,最终成长为最懂你企业工作流的领域专家。

Find Similar Papers

Try Our Examples

  • 查找最近一年关于大语言模型智能体中“显性认知状态更新”或“在线学习机制”的相关论文。
  • 哪篇论文最早在智能体领域提出了存储管理与操作系统类比的概念,本文的弹性存储编排(EMO)与其有何技术演进关系?
  • 探究 AutoAgent 这种多智能体协作框架在具体工业机器人控制或自动驾驶系统的复杂任务调度中的应用潜力。
Contents
[arXiv 2026] AutoAgent:进化认知与弹性内存,通往自进化智能体的必由之路
1. TL;DR
2. 背景定位:从“执行器”到“学习者”的转变
3. 痛点深挖:为什么现在的 Agent 容易“翻车”?
4. 核心方法论:AutoAgent 的三大支柱
4.1. 1. 进化认知 (Evolving Cognition)
4.2. 2. 弹性内存编排 (Elastic Memory Orchestration, EMO)
4.3. 3. 自我演进 (Self-Evolution)
5. 实验与结果:全线 SOTA
6. 深度洞察与总结
6.1. 局限性
6.2. 未来展望