当前 KB vs GBrain:个人知识管理系统对比
核心差异
| 维度 | 本 KB(pi + markdown) | GBrain(Postgres + Agent) |
|---|---|---|
| 规模 | ~20 个文件 | 10,000+ 页面 |
| 搜索 | grep / find(全文扫描) | 向量 + 关键词 RRF 融合 |
| 知识模型 | compiled truth + timeline(刚引入) | compiled truth + timeline(原生) |
| 结构 | 3 子目录分类(agents/research/concepts) | MECE 实体目录(people/companies/deals) |
| 链接 | typed relations(frontmatter) | 有向类型化图谱 + 图遍历 |
| 采集 | 手动 URL → firecrawl 抓取 | 7 种自动化集成(邮件/日历/推特/语音) |
| Agent 循环 | 规则定义了,但靠 Agent 自觉遵守 | 深度集成(skillpack 定义了每一步行为) |
已采纳的改进
从 GBrain 学来并已落地的 5 个设计:
- Compiled Truth + Timeline — wiki 文件分双层,知识不再覆盖丢失
- 类型化链接 — frontmatter 里的
related+relation字段 - MECE 目录结构 — wiki/agents、wiki/research、wiki/concepts
- 元数据规范化 — 所有 raw 文件有完整 frontmatter
- 知识复利循环规则 — AGENTS.md 里定义了 Read-Before-Respond 和 Auto-Propose
暂不采纳的
| 特性 | 原因 |
|---|---|
| Postgres + pgvector | 当前 ~20 个文件,grep 完全够用。等 500+ 文件时再考虑 |
| 自动化集成(邮件/推特/日历) | 本 KB 聚焦 AI agent 研究,不需要实时数据流 |
| Dream Cycle(夜间维护) | 维护量还不需要自动化,手动 review 就够 |
| MCP server 暴露工具 | 当前不需要多设备/多 Agent 访问 |
未来演进路径
当 KB 增长到以下规模时的触发点:
| 规模 | 触发动作 |
|---|---|
| 50+ 文件 | 考虑给 wiki 加全文索引脚本 |
| 200+ 文件 | 考虑 embedding + 向量搜索(可用本地模型) |
| 500+ 文件 | 考虑迁移到 PGLite / SQLite 做结构化存储 |
| 需要多设备访问时 | 考虑 MCP server + ngrok 方案 |
关键洞察
GBrain 最有价值的设计不是技术(Postgres、向量搜索),而是知识模型(compiled truth + timeline)和Agent 行为规范(skillpack 定义了 Agent 什么时候读、什么时候写、怎么写)。这两个东西跟技术栈无关,纯 markdown 就能做,所以我们立刻落地了。
Timeline
- 2026-04-13: 首次产出,基于 GBrain 源码分析对比本 KB 现状
来源 / 参考
- wiki/research/adas-automated-design-of-agentic-systems
- wiki/research/meta-harness
- wiki/concepts/agent-context-engineering
- raw/gbrain