fanfei's blog

自动化智能体优化的演进

从 ADAS 到 Meta-Harness,自动化智能体系统优化经历了从"搜索 agent 设计"到"搜索 harness 代码"的演进。两者共享代码空间搜索的核心思想,但在反馈粒度和搜索机制上有显著差异。

发展脉络

第一代:ADAS / Meta Agent Search (2024)

ADAS 提出了一个开创性的研究方向:自动设计智能体系统。Meta Agent Search 是其代表性算法:

  • 搜索对象:整个 agent 的 forward 函数(Python 代码)
  • 搜索空间:图灵完备的代码空间
  • 反馈机制:档案库(archive)存储先前发现的代码和分数
  • Proposer:FM(GPT-4)作为元智能体
  • 搜索模式:迭代生成,强调新颖性和有趣性

局限性

  • 档案库信息相对压缩(主要是代码和分数)
  • 元智能体无法查看详细执行轨迹
  • 依赖 LLM 直接生成,而非 coding agent

第二代:Meta-Harness (2026)

Meta-Harness 专注优化 LLM 系统中的 harness(外围代码),在 ADAS 的基础上做了关键改进:

  • 搜索对象:harness 代码(提示构建、检索、状态更新策略)
  • 反馈机制完整文件系统访问——源代码、分数、执行轨迹
  • Proposer:Coding agent(Claude Code)而非原始 LLM
  • 搜索模式:自由探索文件系统,无固定父代选择规则

关键差异对比

维度 ADAS / Meta Agent Search Meta-Harness
搜索目标 完整 agent 设计 Harness(LLM 外围代码)
反馈粒度 代码 + 分数 代码 + 分数 + 执行轨迹
每迭代上下文 数千 tokens 高达 10M tokens
Proposer LLM 直接生成 Coding agent(有工具)
信息访问 档案库(结构化) 文件系统(自由探索)
因果推理 有限 深层因果推理(识别混淆因素)
搜索效率 需 30 次迭代 4 次评估匹配基线

核心洞察的演变

  1. 代码空间搜索是可行的(ADAS 证明)→ 代码空间搜索可以更高效(Meta-Harness 证明)
  2. 压缩反馈会丢失关键信号:ADAS 的档案库受限于 LLM 上下文窗口,Meta-Harness 通过文件系统突破了这一限制
  3. Coding agent > 原始 LLM:Claude Code 可以用 grepcat 等工具主动探索历史,而非被动接收固定 prompt
  4. 执行轨迹是关键:消融实验表明,摘要无法替代原始轨迹的诊断价值

对未来的启示

  • 自适应访问外部上下文是趋势(RAG → 渐进式记忆 → 文件系统访问)
  • 随着编码 agent 能力提升,最小化搜索结构可能是更好的策略
  • 从"搜索 agent 设计"到"搜索上下文管理策略",优化粒度在细化
  • 未来方向:co-evolve harness 和模型权重

Timeline

  • 2024-08: ADAS 论文发表,奠定代码空间搜索的基础
  • 2026-03: Meta-Harness 论文发表,展示完整历史访问的威力
  • 2026-04-13: 整理进 KB,梳理演进脉络