大家好,我是何三,独立开发者

最近刷 GitHub 的时候,看到一个项目直接钉在了 Trending 榜上 —— Hermes Agent,25.3k Star,3.3k Fork。
点进去看了下,发现这东西不太一样。
市面上的 AI Agent 我见过不少,大部分本质上是"聊天框 + 工具调用"的缝合体。你问它一个问题,它帮你跑个命令、写个文件,然后——就没了。下次再聊,它又是白纸一张。
Hermes 不这么干。它有一个闭环学习系统——用完之后会自动总结经验、生成技能、记住你的偏好。简单说就是:越用越聪明。
这个项目来自 Nous Research,一家专门做开源模型训练的实验室(Hermes、Nomos、Psyche 模型都出自他们手)。所以这个 Agent 不是玩具,是训练模型的人自己造的生产力工具。
它和别的 Agent 有什么不一样?
核心区别就一句话:Hermes 是目前唯一一个内置了学习闭环的 AI Agent。
拆开来说,这个"闭环"包含四个环节:

自动创建技能 — 当它帮你完成了一个复杂任务(比如部署一个完整的 Web 服务),它会自动把这个过程提炼成一个可复用的 Skill。下次遇到类似任务,直接加载对应技能,不需要你重复描述需求。
技能自优化 — 不是生成完就完了。在后续使用中,Hermes 会不断修正和改进已有技能。你纠正了它一次,它真的会记住。
记忆持久化 — 两个核心文件:MEMORY.md(环境信息、踩过的坑)和 USER.md(你的偏好、沟通风格)。每次会话开始时加载到系统提示词里,跨会话持续生效。而且它有字符上限——满了会自动整理压缩旧内容,不会无限膨胀。
用户建模 — 集成了 Honcho 引擎做辩证用户建模,简单说就是它会越来越懂你。你习惯简短回复,它下次就不会长篇大论;你偏好 TypeScript,它就不会默认写 JavaScript。
更关键的是,所有技能都兼容 agentskills.io 开放标准。这意味着技能可以跨平台共享,社区贡献的技能也能直接拿来用。
不只是你的笔记本上的工具
很多 Agent 的使用场景就是"打开终端、敲命令、关闭终端"。Hermes 的野心明显更大。
6 种部署后端:本地、Docker、SSH、Daytona、Modal、Singularity。

这里面最让我感兴趣的 Daytona 和 Modal 方案。
Daytona 提供了 Serverless 持久化环境——你的 Agent 空闲时休眠,需要时唤醒,中间几乎不花钱。Modal 类似。这意味着你可以花 $5/月 租一台最便宜的 VPS,或者用 Serverless 方案把成本压到几乎为零。
它不是一个绑在你笔记本上的工具。你可以把 Hermes 跑在云服务器上,然后通过 Telegram 跟它对话。

一个 Gateway 进程,同时接入 Telegram、Discord、Slack、WhatsApp、Signal。你在手机上发语音,它自动转写处理;你在电脑上用 CLI,共享同一套会话历史。
想想这个场景: 早上在地铁上用 Telegram 让它跑个数据分析脚本,到公司打开电脑,结果已经出来了。这种体验不是任何"IDE 插件型 Agent"能给的。
模型不绑定,随便换
这是另一个让我觉得"这项目靠谱"的点。
Hermes 支持的模型提供商多到有点离谱:
- Nous Portal(官方,零配置)
- OpenRouter(200+ 模型)
- OpenAI、Anthropic
- DeepSeek、Kimi/Moonshot、MiniMax
- 阿里云 DashScope(通义千问)
- HuggingFace(20+ 开源模型)
- GitHub Copilot
- 任何 OpenAI 兼容的自定义端点(VLLM、Ollama、SGLang 都行)
切换方式也很直接:
hermes model # 交互式选择模型
一行命令,零代码改动,没有厂商锁定。这在 2026 年的 Agent 生态里,算是比较少见的开放姿态。
40+ 工具,还能接 MCP
开箱即用就带了 40 多个工具:文件操作、终端命令、网页搜索、内容提取、代码执行、图像生成、TTS 语音合成……
而且支持 MCP(Model Context Protocol)。简单说,任何 MCP Server 提供的工具都可以直接接入 Hermes。这意味着它的能力边界不是固定的,社区生态有多少 MCP 工具,它就能扩展多少。
还有一个比较实用的功能:定时任务。内置了 cron 调度器,可以用自然语言设置。比如"每天早上 9 点给我生成一份 GitHub 仓库动态摘要",发到 Telegram 上。全自动运行,不需要你干预。
子 Agent 并行也是个亮点。复杂任务可以拆分给多个隔离的子 Agent 同时跑,每个子 Agent 独立执行互不干扰。比如同时监控 3 个服务器的日志 + 部署一个新服务。
60 秒上手
安装就一行命令:
# Linux / macOS / WSL2
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
装完重新加载 shell:
source ~/.bashrc # 或者 source ~/.zshrc
然后配置模型、开始聊天:
hermes setup # 交互式配置向导(模型、工具、网关一次搞定)
hermes # 开始对话
一些常用的斜杠命令:
| 命令 | 功能 |
|---|---|
/new |
开始新会话 |
/model openrouter:claude-3.5-sonnet |
切换模型 |
/compress |
压缩上下文,节省 token |
/skills |
浏览可用技能 |
/insights --days 7 |
查看过去 7 天的使用统计 |
如果要从 Telegram/Discord 接入:
hermes gateway setup # 配置消息平台
hermes gateway start # 启动网关
就这样。没有复杂的配置文件,没有"先装这个依赖再装那个包"的折磨。
几点个人看法
记忆系统是最大的差异化优势。 现在的 Agent 普遍是"无状态"的——每次对话从零开始。Hermes 的持久化记忆让它更像一个"数字助手"而不是"一次性工具"。它能记住你的项目结构、你的编码习惯、你踩过的坑。这个体验上的差距,用过就回不去了。
$5 VPS + Telegram 这个组合真的很有想象力。以前 Agent 的使用模式是"坐在电脑前打开终端",现在变成了"随时随地掏出手机说话"。这不仅是使用场景的扩展,更是一种交互方式的转变。
开放标准是个加分项。 agentskills.io 兼容意味着技能生态可以社区共建。不像某些闭源 Agent,能力上限取决于厂商给什么。Hermes 的能力天花板取决于你接了多少 MCP Server、装了多少社区技能。
当然也有不完美的地方。文档虽然已经比较完善了,但部分高级功能(比如 RL 训练集成、Trajectory 压缩)更偏向研究者,普通开发者暂时用不上。Windows 用户也必须走 WSL2,原生不支持。
但整体来说,如果你正在找一个真正能"长期陪伴"的 AI Agent,Hermes 是目前最值得尝试的选项。 它不只是一个工具,更像是一个会成长的数字伙伴。
项目地址: https://github.com/NousResearch/hermes-agent 官方文档: https://hermes-agent.nousresearch.com/docs/ 许可证: MIT(完全开源免费)
本文使用 MGO 编辑并发布
关注"何三笔记",回复"mgo" 免费下载使用