fanfei's blog

当前 KB vs GBrain：个人知识管理系统对比

最后更新：2026-04-13

核心差异

维度	本 KB（pi + markdown）	GBrain（Postgres + Agent）
规模	~20 个文件	10,000+ 页面
搜索	grep / find（全文扫描）	向量 + 关键词 RRF 融合
知识模型	compiled truth + timeline（刚引入）	compiled truth + timeline（原生）
结构	3 子目录分类（agents/research/concepts）	MECE 实体目录（people/companies/deals）
链接	typed relations（frontmatter）	有向类型化图谱 + 图遍历
采集	手动 URL → firecrawl 抓取	7 种自动化集成（邮件/日历/推特/语音）
Agent 循环	规则定义了，但靠 Agent 自觉遵守	深度集成（skillpack 定义了每一步行为）

已采纳的改进

从 GBrain 学来并已落地的 5 个设计：

Compiled Truth + Timeline — wiki 文件分双层，知识不再覆盖丢失
类型化链接 — frontmatter 里的 related + relation 字段
MECE 目录结构 — wiki/agents、wiki/research、wiki/concepts
元数据规范化 — 所有 raw 文件有完整 frontmatter
知识复利循环规则 — AGENTS.md 里定义了 Read-Before-Respond 和 Auto-Propose

暂不采纳的

特性	原因
Postgres + pgvector	当前 ~20 个文件，grep 完全够用。等 500+ 文件时再考虑
自动化集成（邮件/推特/日历）	本 KB 聚焦 AI agent 研究，不需要实时数据流
Dream Cycle（夜间维护）	维护量还不需要自动化，手动 review 就够
MCP server 暴露工具	当前不需要多设备/多 Agent 访问

未来演进路径

当 KB 增长到以下规模时的触发点：

规模	触发动作
50+ 文件	考虑给 wiki 加全文索引脚本
200+ 文件	考虑 embedding + 向量搜索（可用本地模型）
500+ 文件	考虑迁移到 PGLite / SQLite 做结构化存储
需要多设备访问时	考虑 MCP server + ngrok 方案

关键洞察

GBrain 最有价值的设计不是技术（Postgres、向量搜索），而是知识模型（compiled truth + timeline）和Agent 行为规范（skillpack 定义了 Agent 什么时候读、什么时候写、怎么写）。这两个东西跟技术栈无关，纯 markdown 就能做，所以我们立刻落地了。

Timeline

2026-04-13: 首次产出，基于 GBrain 源码分析对比本 KB 现状

来源 / 参考

wiki/research/adas-automated-design-of-agentic-systems
wiki/research/meta-harness
wiki/concepts/agent-context-engineering
raw/gbrain