自动化智能体优化的演进
从 ADAS 到 Meta-Harness,自动化智能体系统优化经历了从"搜索 agent 设计"到"搜索 harness 代码"的演进。两者共享代码空间搜索的核心思想,但在反馈粒度和搜索机制上有显著差异。
发展脉络
第一代:ADAS / Meta Agent Search (2024)
ADAS 提出了一个开创性的研究方向:自动设计智能体系统。Meta Agent Search 是其代表性算法:
- 搜索对象:整个 agent 的
forward函数(Python 代码) - 搜索空间:图灵完备的代码空间
- 反馈机制:档案库(archive)存储先前发现的代码和分数
- Proposer:FM(GPT-4)作为元智能体
- 搜索模式:迭代生成,强调新颖性和有趣性
局限性:
- 档案库信息相对压缩(主要是代码和分数)
- 元智能体无法查看详细执行轨迹
- 依赖 LLM 直接生成,而非 coding agent
第二代:Meta-Harness (2026)
Meta-Harness 专注优化 LLM 系统中的 harness(外围代码),在 ADAS 的基础上做了关键改进:
- 搜索对象:harness 代码(提示构建、检索、状态更新策略)
- 反馈机制:完整文件系统访问——源代码、分数、执行轨迹
- Proposer:Coding agent(Claude Code)而非原始 LLM
- 搜索模式:自由探索文件系统,无固定父代选择规则
关键差异对比
| 维度 | ADAS / Meta Agent Search | Meta-Harness |
|---|---|---|
| 搜索目标 | 完整 agent 设计 | Harness(LLM 外围代码) |
| 反馈粒度 | 代码 + 分数 | 代码 + 分数 + 执行轨迹 |
| 每迭代上下文 | 数千 tokens | 高达 10M tokens |
| Proposer | LLM 直接生成 | Coding agent(有工具) |
| 信息访问 | 档案库(结构化) | 文件系统(自由探索) |
| 因果推理 | 有限 | 深层因果推理(识别混淆因素) |
| 搜索效率 | 需 30 次迭代 | 4 次评估匹配基线 |
核心洞察的演变
- 代码空间搜索是可行的(ADAS 证明)→ 代码空间搜索可以更高效(Meta-Harness 证明)
- 压缩反馈会丢失关键信号:ADAS 的档案库受限于 LLM 上下文窗口,Meta-Harness 通过文件系统突破了这一限制
- Coding agent > 原始 LLM:Claude Code 可以用
grep、cat等工具主动探索历史,而非被动接收固定 prompt - 执行轨迹是关键:消融实验表明,摘要无法替代原始轨迹的诊断价值
对未来的启示
- 自适应访问外部上下文是趋势(RAG → 渐进式记忆 → 文件系统访问)
- 随着编码 agent 能力提升,最小化搜索结构可能是更好的策略
- 从"搜索 agent 设计"到"搜索上下文管理策略",优化粒度在细化
- 未来方向:co-evolve harness 和模型权重
Timeline
- 2024-08: ADAS 论文发表,奠定代码空间搜索的基础
- 2026-03: Meta-Harness 论文发表,展示完整历史访问的威力
- 2026-04-13: 整理进 KB,梳理演进脉络