大家好,我是何三,独立开发者

用 AI 写代码这事儿,有一个特烦的体验:每次开新会话,AI 都像个刚出厂的机器人。

你上周刚搭好的 JWT 认证架构,本周问它限流怎么加——它完全不知道你在说什么。你得把目录结构、中间件路径、选型理由全部重新交代一遍。

烦不烦?说实话,烦透了。

我也试过 CLAUDE.md、.cursorrules 这些内置方案。200 行的容量上限,没多久就满了。手动维护?更扯,我是来偷懒的,不是来当文档管理员的。

然后我发现了 agentmemory

一个 npm 命令装完,所有 AI 编码助手——Claude Code、Cursor、Codex CLI、Gemini CLI、Windsurf——全部共享同一个记忆体。不用外部数据库,纯本地运行,每秒检索只要 14 毫秒。

说白了,它就是给你的 AI 编程助手装了个海马体。

反差数据:先看三组硬指标

agentmemory 核心反差数据

先甩三组数字,再讲原理。

第一,Token 消耗降低 92%。

传统做法是把全部上下文塞进窗口,一年跑下来 1950 万 Token——贵到离谱,而且窗口根本塞不下。如果用 LLM 做摘要,一年也要 650K Token,折合 $500。

agentmemory 怎么搞的?它把记忆压缩成向量 + BM25 混合索引,每次只取最相关的上下文。一年才 170K Token,成本 $10。

如果你用本地嵌入模型 all-MiniLM-L6-v2——这个钱也不用花,$0。

第二,检索准确率 95.2%。

这个数据来自 ICLR 2025 的 LongMemEval-S 基准测试,500 道题。同样是混排搜索,BM25 只有 86.2% 的 R@5,agentmemory 做到了 95.2%。

对比一下那些 5 万星的热门竞品:mem0 在 LoCoMo 上只有 68.5%,Letta/MemGPT 是 83.2%。

第三,零外部数据库依赖。

做一个检索系统,通常要搭 Postgres、再配个 Qdrant 或者 pgvector。agentmemory 什么都不需要——一个 SQLite 文件搞定全部存储。装完就能用,不需要 DBA,不需要 Docker Compose。

它是怎么做到的?用最土的话解释

这东西的底层引擎叫 iii,用 Rust 写的。

它做了四件事:

第一,自动捕获。 装了 12 个钩子,你的 AI 助手每次操作——写代码、查文件、跑命令——全部自动录下来。零手动操作,不需要你主动说"记一下这个"。

第二,压缩索引。 录下来的东西不会躺在硬盘上长灰。它用 BM25(关键词)+ 向量(语义)+ 知识图谱(关系)三种方式同时索引,然后用 RRF 融合算法打分,找到最相关的内容。

第三,生命周期管理。 这玩意儿有四层记忆分级。新鲜的、重要的内容保留;旧数据自动衰减、遗忘。不会像 CLAUDE.md 那样 200 行就爆炸。

第四,跨 Agent 共享。 一个记忆服务器,16 种 AI 编程工具全部能访问。你用 Claude Code 写的代码结构,切换到 Cursor 时它也知道。

说到 Rust 我就想起一件事。之前有个开源作者跟我说,Rust 的编译器比他的前女友还难哄,但凡你少写一个分号,它就给你甩脸色。但性能是真的香,agentmemory 每个查询 14ms,跟这种底层选型有很大关系。跑题了,回来。

原理大概是这样,细节可能有出入——有懂的大佬欢迎指正。

总之这就是一个你感知不到它在运行,但每次都会觉得"AI 怎么变聪明了"的东西。

上手试试?三分钟搞定

这是最离谱的地方:装它只需要一个命令。

npx @agentmemory/agentmemory

跑完之后,它在后台开了一个记忆服务器,端口 3111。

然后你再开一个终端,运行演示:

npx @agentmemory/agentmemory demo

这个 demo 会灌入三个真实的开发会话——JWT 认证搭建、N+1 查询优化、接口限流——然后让你试语义搜索。你搜"数据库性能优化",它能返回 N+1 查询优化的那一次修改。

注意,普通关键字搜索做不到这个。

你还可以访问 http://localhost:3113,实时看到记忆图谱在生成。节点、连接、时间线,全部可视。

想跟 Claude Code 打通?一行命令:

agentmemory connect claude-code

或者直接装全局版:

npm install -g @agentmemory/agentmemory
agentmemory

然后它就常驻后台了。以后每次打开 Claude Code、Cursor、Codex CLI……它什么都记得。

跟同类一比,差距更明显

维度 agentmemory mem0 (53K⭐) Letta/MemGPT (22K⭐) CLAUDE.md
检索准确率 R@5 95.2% 68.5% 83.2% 纯 grep
自动捕获 ✅ 12个钩子,0手动 ❌ 要手动 add() ❌ Agent自编辑 ❌ 手动写
外部依赖 ❌ 无 ✅ Qdrant/pgvector ✅ Postgres+向量库 ❌ 无
跨Agent ✅ 16种工具 ❌ API无协调 ❌ 仅限Letta内 ❌ 各管各
年费 $10(或$0) 看集成方式 看部署方式 免费但废手
实时看板 ✅ 本地3113端口 ❌ 云端控制台 ❌ 云端控制台 ❌ 无

说白了,agentmemory 走的是反常识路线——别人都在堆外部数据库、堆云端架构,它一个 SQLite 文件全搞定,性能反而更好。

一个小建议

如果你已经是 AI 编程的重度用户,这东西应该会成为你的日常标配

我不是说它完美——有些钩子的文档写得跟谜语人似的,比如 Claude Code 的 hook 路径依赖问题,你升级版本后可能还得重新跑一次 agentmemory connect claude-code --with-hooks。但这些问题社区里都有 Issue 跟踪,作者更新也勤快(v0.9.22 刚修了 22 个问题),总体瑕不掩瑜。

作者的话说得好:Session 1 你配好了 JWT 认证,Session 2 你再问限流——AI 已经知道你用 jose 中间件、路径在 src/middleware/auth.ts、选 jose 而不是 jsonwebtoken 是因为 Edge 兼容性。不用重复解释,不用复制粘贴,AI 就是知道。

这种感觉,真的有点爽。

项目地址:https://github.com/rohitg00/agentmemory

本文使用 MGO 编辑并发布

关注"何三笔记",回复"mgo" 免费下载使用