开源推荐

其他

25.3k Star，能自我进化的AI Agent！Hermes Agent 到底凭什么？

发表于 2026年04月06日阅读 7 评论 0

大家好，我是何三，独立开发者

hermes_cover

最近刷 GitHub 的时候，看到一个项目直接钉在了 Trending 榜上 —— Hermes Agent，25.3k Star，3.3k Fork。

点进去看了下，发现这东西不太一样。

市面上的 AI Agent 我见过不少，大部分本质上是"聊天框 + 工具调用"的缝合体。你问它一个问题，它帮你跑个命令、写个文件，然后——就没了。下次再聊，它又是白纸一张。

Hermes 不这么干。它有一个闭环学习系统——用完之后会自动总结经验、生成技能、记住你的偏好。简单说就是：越用越聪明。

这个项目来自 Nous Research，一家专门做开源模型训练的实验室（Hermes、Nomos、Psyche 模型都出自他们手）。所以这个 Agent 不是玩具，是训练模型的人自己造的生产力工具。

它和别的 Agent 有什么不一样？

核心区别就一句话：Hermes 是目前唯一一个内置了学习闭环的 AI Agent。

拆开来说，这个"闭环"包含四个环节：

hermes_01

自动创建技能 — 当它帮你完成了一个复杂任务（比如部署一个完整的 Web 服务），它会自动把这个过程提炼成一个可复用的 Skill。下次遇到类似任务，直接加载对应技能，不需要你重复描述需求。

技能自优化 — 不是生成完就完了。在后续使用中，Hermes 会不断修正和改进已有技能。你纠正了它一次，它真的会记住。

记忆持久化 — 两个核心文件：MEMORY.md（环境信息、踩过的坑）和 USER.md（你的偏好、沟通风格）。每次会话开始时加载到系统提示词里，跨会话持续生效。而且它有字符上限——满了会自动整理压缩旧内容，不会无限膨胀。

用户建模 — 集成了 Honcho 引擎做辩证用户建模，简单说就是它会越来越懂你。你习惯简短回复，它下次就不会长篇大论；你偏好 TypeScript，它就不会默认写 JavaScript。

更关键的是，所有技能都兼容 agentskills.io 开放标准。这意味着技能可以跨平台共享，社区贡献的技能也能直接拿来用。

不只是你的笔记本上的工具

很多 Agent 的使用场景就是"打开终端、敲命令、关闭终端"。Hermes 的野心明显更大。

6 种部署后端：本地、Docker、SSH、Daytona、Modal、Singularity。

hermes_02

这里面最让我感兴趣的 Daytona 和 Modal 方案。

Daytona 提供了 Serverless 持久化环境——你的 Agent 空闲时休眠，需要时唤醒，中间几乎不花钱。Modal 类似。这意味着你可以花 $5/月 租一台最便宜的 VPS，或者用 Serverless 方案把成本压到几乎为零。

它不是一个绑在你笔记本上的工具。你可以把 Hermes 跑在云服务器上，然后通过 Telegram 跟它对话。

hermes_03

一个 Gateway 进程，同时接入 Telegram、Discord、Slack、WhatsApp、Signal。你在手机上发语音，它自动转写处理；你在电脑上用 CLI，共享同一套会话历史。

想想这个场景： 早上在地铁上用 Telegram 让它跑个数据分析脚本，到公司打开电脑，结果已经出来了。这种体验不是任何"IDE 插件型 Agent"能给的。

模型不绑定，随便换

这是另一个让我觉得"这项目靠谱"的点。

Hermes 支持的模型提供商多到有点离谱：

Nous Portal（官方，零配置）
OpenRouter（200+ 模型）
OpenAI、Anthropic
DeepSeek、Kimi/Moonshot、MiniMax
阿里云 DashScope（通义千问）
HuggingFace（20+ 开源模型）
GitHub Copilot
任何 OpenAI 兼容的自定义端点（VLLM、Ollama、SGLang 都行）

切换方式也很直接：

hermes model  # 交互式选择模型

一行命令，零代码改动，没有厂商锁定。这在 2026 年的 Agent 生态里，算是比较少见的开放姿态。

40+ 工具，还能接 MCP

开箱即用就带了 40 多个工具：文件操作、终端命令、网页搜索、内容提取、代码执行、图像生成、TTS 语音合成……

而且支持 MCP（Model Context Protocol）。简单说，任何 MCP Server 提供的工具都可以直接接入 Hermes。这意味着它的能力边界不是固定的，社区生态有多少 MCP 工具，它就能扩展多少。

还有一个比较实用的功能：定时任务。内置了 cron 调度器，可以用自然语言设置。比如"每天早上 9 点给我生成一份 GitHub 仓库动态摘要"，发到 Telegram 上。全自动运行，不需要你干预。

子 Agent 并行也是个亮点。复杂任务可以拆分给多个隔离的子 Agent 同时跑，每个子 Agent 独立执行互不干扰。比如同时监控 3 个服务器的日志 + 部署一个新服务。

60 秒上手

安装就一行命令：

# Linux / macOS / WSL2
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

装完重新加载 shell：

source ~/.bashrc    # 或者 source ~/.zshrc

然后配置模型、开始聊天：

hermes setup        # 交互式配置向导（模型、工具、网关一次搞定）
hermes              # 开始对话

一些常用的斜杠命令：

命令	功能
`/new`	开始新会话
`/model openrouter:claude-3.5-sonnet`	切换模型
`/compress`	压缩上下文，节省 token
`/skills`	浏览可用技能
`/insights --days 7`	查看过去 7 天的使用统计

如果要从 Telegram/Discord 接入：

hermes gateway setup    # 配置消息平台
hermes gateway start    # 启动网关

就这样。没有复杂的配置文件，没有"先装这个依赖再装那个包"的折磨。

几点个人看法

记忆系统是最大的差异化优势。 现在的 Agent 普遍是"无状态"的——每次对话从零开始。Hermes 的持久化记忆让它更像一个"数字助手"而不是"一次性工具"。它能记住你的项目结构、你的编码习惯、你踩过的坑。这个体验上的差距，用过就回不去了。

$5 VPS + Telegram 这个组合真的很有想象力。以前 Agent 的使用模式是"坐在电脑前打开终端"，现在变成了"随时随地掏出手机说话"。这不仅是使用场景的扩展，更是一种交互方式的转变。

开放标准是个加分项。 agentskills.io 兼容意味着技能生态可以社区共建。不像某些闭源 Agent，能力上限取决于厂商给什么。Hermes 的能力天花板取决于你接了多少 MCP Server、装了多少社区技能。

当然也有不完美的地方。文档虽然已经比较完善了，但部分高级功能（比如 RL 训练集成、Trajectory 压缩）更偏向研究者，普通开发者暂时用不上。Windows 用户也必须走 WSL2，原生不支持。

但整体来说，如果你正在找一个真正能"长期陪伴"的 AI Agent，Hermes 是目前最值得尝试的选项。 它不只是一个工具，更像是一个会成长的数字伙伴。

项目地址： https://github.com/NousResearch/hermes-agent 官方文档： https://hermes-agent.nousresearch.com/docs/ 许可证： MIT（完全开源免费）

本文使用 MGO 编辑并发布

关注"何三笔记"，回复"mgo" 免费下载使用

版权声明：如无特殊说明，文章均为何三笔记原创，转载请注明出处

本文链接：https://www.h3blog.com/article/761/

它和别的 Agent 有什么不一样？
不只是你的笔记本上的工具
模型不绑定，随便换
40+ 工具，还能接 MCP
60 秒上手
几点个人看法