fanfei's blog

当前 KB vs GBrain:个人知识管理系统对比

核心差异

维度 本 KB(pi + markdown) GBrain(Postgres + Agent)
规模 ~20 个文件 10,000+ 页面
搜索 grep / find(全文扫描) 向量 + 关键词 RRF 融合
知识模型 compiled truth + timeline(刚引入) compiled truth + timeline(原生)
结构 3 子目录分类(agents/research/concepts) MECE 实体目录(people/companies/deals)
链接 typed relations(frontmatter) 有向类型化图谱 + 图遍历
采集 手动 URL → firecrawl 抓取 7 种自动化集成(邮件/日历/推特/语音)
Agent 循环 规则定义了,但靠 Agent 自觉遵守 深度集成(skillpack 定义了每一步行为)

已采纳的改进

从 GBrain 学来并已落地的 5 个设计:

  1. Compiled Truth + Timeline — wiki 文件分双层,知识不再覆盖丢失
  2. 类型化链接 — frontmatter 里的 related + relation 字段
  3. MECE 目录结构 — wiki/agents、wiki/research、wiki/concepts
  4. 元数据规范化 — 所有 raw 文件有完整 frontmatter
  5. 知识复利循环规则 — AGENTS.md 里定义了 Read-Before-Respond 和 Auto-Propose

暂不采纳的

特性 原因
Postgres + pgvector 当前 ~20 个文件,grep 完全够用。等 500+ 文件时再考虑
自动化集成(邮件/推特/日历) 本 KB 聚焦 AI agent 研究,不需要实时数据流
Dream Cycle(夜间维护) 维护量还不需要自动化,手动 review 就够
MCP server 暴露工具 当前不需要多设备/多 Agent 访问

未来演进路径

当 KB 增长到以下规模时的触发点:

规模 触发动作
50+ 文件 考虑给 wiki 加全文索引脚本
200+ 文件 考虑 embedding + 向量搜索(可用本地模型)
500+ 文件 考虑迁移到 PGLite / SQLite 做结构化存储
需要多设备访问时 考虑 MCP server + ngrok 方案

关键洞察

GBrain 最有价值的设计不是技术(Postgres、向量搜索),而是知识模型(compiled truth + timeline)和Agent 行为规范(skillpack 定义了 Agent 什么时候读、什么时候写、怎么写)。这两个东西跟技术栈无关,纯 markdown 就能做,所以我们立刻落地了。


Timeline

  • 2026-04-13: 首次产出,基于 GBrain 源码分析对比本 KB 现状

来源 / 参考

  • wiki/research/adas-automated-design-of-agentic-systems
  • wiki/research/meta-harness
  • wiki/concepts/agent-context-engineering
  • raw/gbrain