fanfei's blog

ADAS: Automated Design of Agentic Systems

自动化智能体系统设计(ADAS)是一个新兴研究领域,旨在自动发现和设计强大的智能体系统,包括发明新的构建块和/或以新的方式组合它们。本文提出的 Meta Agent Search 算法通过在代码空间中搜索,让元智能体迭代编程出更好的智能体。

来源: arXiv:2408.08435 — Hu, Lu, Clune (UBC/Vector Institute), ICLR 2025

核心思想

机器学习的历史表明,手工设计的解决方案最终会被学习到的解决方案取代(如 HOG → CNN,手工损失函数 → 学习损失函数)。ADAS 将这一规律延伸到智能体系统:手工设计的 prompt、工作流和工具组合应该被自动搜索发现的方案取代。

ADAS 三要素

组件 说明
搜索空间 定义哪些智能体系统可以被表示和发现(如仅 prompt、图结构、代码)
搜索算法 定义如何探索搜索空间(如 RL、迭代生成、进化)
评估函数 定义如何评估候选智能体(性能、成本、延迟、安全性)

代码空间搜索的关键优势

  • 图灵完备:理论上可以发现任何可能的智能体系统
  • 可解释性:代码比权重或图结构更易审计
  • 利用现有生态:可直接搜索 LangChain 等框架中的组件
  • FM 擅长编码:搜索空间与 FM 能力高度对齐

Meta Agent Search 算法

  1. 用基线智能体(CoT、Self-Refine 等)初始化档案库
  2. 元智能体基于档案库生成新想法并实现代码
  3. 通过两次 self-reflection 确保新颖性
  4. 在验证集上评估,出错则 self-refine 修正(最多 5 次)
  5. 将新智能体加入档案库,循环继续

实验结果

任务 关键结果
ARC 逻辑谜题 渐进发现超越手写基线的智能体
DROP 阅读理解 F1 提升 13.6/100
MGSM 数学 准确率提升 14.4%
跨域迁移 从数学迁移到阅读理解仍超越基线
跨模型迁移 GPT-3.5 发现的智能体在 Claude Sonnet 上达到 48.3% ARC 准确率

重要发现

  • 发现的智能体具有强迁移性:在跨域、跨模型时仍保持优越性能
  • 搜索过程中出现了垫脚石效应:早期的突破不一定立即提高性能,但为后续发现提供了基础
  • 超越了仅优化 prompt 的方法(如 OPRO),证明学习所有组件的重要性

Timeline

  • 2024-08: 论文发表 arXiv:2408.08435
  • 2025: 在 ICLR 2025 正式发表
  • 2026-04-13: 整理进 KB