大家好,我是何三,独立开发者

hermes_cover

最近刷 GitHub 的时候,看到一个项目直接钉在了 Trending 榜上 —— Hermes Agent,25.3k Star,3.3k Fork。

点进去看了下,发现这东西不太一样。

市面上的 AI Agent 我见过不少,大部分本质上是"聊天框 + 工具调用"的缝合体。你问它一个问题,它帮你跑个命令、写个文件,然后——就没了。下次再聊,它又是白纸一张。

Hermes 不这么干。它有一个闭环学习系统——用完之后会自动总结经验、生成技能、记住你的偏好。简单说就是:越用越聪明

这个项目来自 Nous Research,一家专门做开源模型训练的实验室(Hermes、Nomos、Psyche 模型都出自他们手)。所以这个 Agent 不是玩具,是训练模型的人自己造的生产力工具。


它和别的 Agent 有什么不一样?

核心区别就一句话:Hermes 是目前唯一一个内置了学习闭环的 AI Agent。

拆开来说,这个"闭环"包含四个环节:

hermes_01

自动创建技能 — 当它帮你完成了一个复杂任务(比如部署一个完整的 Web 服务),它会自动把这个过程提炼成一个可复用的 Skill。下次遇到类似任务,直接加载对应技能,不需要你重复描述需求。

技能自优化 — 不是生成完就完了。在后续使用中,Hermes 会不断修正和改进已有技能。你纠正了它一次,它真的会记住。

记忆持久化 — 两个核心文件:MEMORY.md(环境信息、踩过的坑)和 USER.md(你的偏好、沟通风格)。每次会话开始时加载到系统提示词里,跨会话持续生效。而且它有字符上限——满了会自动整理压缩旧内容,不会无限膨胀。

用户建模 — 集成了 Honcho 引擎做辩证用户建模,简单说就是它会越来越懂你。你习惯简短回复,它下次就不会长篇大论;你偏好 TypeScript,它就不会默认写 JavaScript。

更关键的是,所有技能都兼容 agentskills.io 开放标准。这意味着技能可以跨平台共享,社区贡献的技能也能直接拿来用。


不只是你的笔记本上的工具

很多 Agent 的使用场景就是"打开终端、敲命令、关闭终端"。Hermes 的野心明显更大。

6 种部署后端:本地、Docker、SSH、Daytona、Modal、Singularity。

hermes_02

这里面最让我感兴趣的 Daytona 和 Modal 方案。

Daytona 提供了 Serverless 持久化环境——你的 Agent 空闲时休眠,需要时唤醒,中间几乎不花钱。Modal 类似。这意味着你可以花 $5/月 租一台最便宜的 VPS,或者用 Serverless 方案把成本压到几乎为零。

它不是一个绑在你笔记本上的工具。你可以把 Hermes 跑在云服务器上,然后通过 Telegram 跟它对话。

hermes_03

一个 Gateway 进程,同时接入 Telegram、Discord、Slack、WhatsApp、Signal。你在手机上发语音,它自动转写处理;你在电脑上用 CLI,共享同一套会话历史。

想想这个场景: 早上在地铁上用 Telegram 让它跑个数据分析脚本,到公司打开电脑,结果已经出来了。这种体验不是任何"IDE 插件型 Agent"能给的。


模型不绑定,随便换

这是另一个让我觉得"这项目靠谱"的点。

Hermes 支持的模型提供商多到有点离谱:

  • Nous Portal(官方,零配置)
  • OpenRouter(200+ 模型)
  • OpenAI、Anthropic
  • DeepSeek、Kimi/Moonshot、MiniMax
  • 阿里云 DashScope(通义千问)
  • HuggingFace(20+ 开源模型)
  • GitHub Copilot
  • 任何 OpenAI 兼容的自定义端点(VLLM、Ollama、SGLang 都行)

切换方式也很直接:

hermes model  # 交互式选择模型

一行命令,零代码改动,没有厂商锁定。这在 2026 年的 Agent 生态里,算是比较少见的开放姿态。


40+ 工具,还能接 MCP

开箱即用就带了 40 多个工具:文件操作、终端命令、网页搜索、内容提取、代码执行、图像生成、TTS 语音合成……

而且支持 MCP(Model Context Protocol)。简单说,任何 MCP Server 提供的工具都可以直接接入 Hermes。这意味着它的能力边界不是固定的,社区生态有多少 MCP 工具,它就能扩展多少。

还有一个比较实用的功能:定时任务。内置了 cron 调度器,可以用自然语言设置。比如"每天早上 9 点给我生成一份 GitHub 仓库动态摘要",发到 Telegram 上。全自动运行,不需要你干预。

子 Agent 并行也是个亮点。复杂任务可以拆分给多个隔离的子 Agent 同时跑,每个子 Agent 独立执行互不干扰。比如同时监控 3 个服务器的日志 + 部署一个新服务。


60 秒上手

安装就一行命令:

# Linux / macOS / WSL2
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

装完重新加载 shell:

source ~/.bashrc    # 或者 source ~/.zshrc

然后配置模型、开始聊天:

hermes setup        # 交互式配置向导(模型、工具、网关一次搞定)
hermes              # 开始对话

一些常用的斜杠命令:

命令 功能
/new 开始新会话
/model openrouter:claude-3.5-sonnet 切换模型
/compress 压缩上下文,节省 token
/skills 浏览可用技能
/insights --days 7 查看过去 7 天的使用统计

如果要从 Telegram/Discord 接入:

hermes gateway setup    # 配置消息平台
hermes gateway start    # 启动网关

就这样。没有复杂的配置文件,没有"先装这个依赖再装那个包"的折磨。


几点个人看法

记忆系统是最大的差异化优势。 现在的 Agent 普遍是"无状态"的——每次对话从零开始。Hermes 的持久化记忆让它更像一个"数字助手"而不是"一次性工具"。它能记住你的项目结构、你的编码习惯、你踩过的坑。这个体验上的差距,用过就回不去了。

$5 VPS + Telegram 这个组合真的很有想象力。以前 Agent 的使用模式是"坐在电脑前打开终端",现在变成了"随时随地掏出手机说话"。这不仅是使用场景的扩展,更是一种交互方式的转变。

开放标准是个加分项。 agentskills.io 兼容意味着技能生态可以社区共建。不像某些闭源 Agent,能力上限取决于厂商给什么。Hermes 的能力天花板取决于你接了多少 MCP Server、装了多少社区技能。

当然也有不完美的地方。文档虽然已经比较完善了,但部分高级功能(比如 RL 训练集成、Trajectory 压缩)更偏向研究者,普通开发者暂时用不上。Windows 用户也必须走 WSL2,原生不支持。

但整体来说,如果你正在找一个真正能"长期陪伴"的 AI Agent,Hermes 是目前最值得尝试的选项。 它不只是一个工具,更像是一个会成长的数字伙伴。


项目地址: https://github.com/NousResearch/hermes-agent 官方文档: https://hermes-agent.nousresearch.com/docs/ 许可证: MIT(完全开源免费)

本文使用 MGO 编辑并发布

关注"何三笔记",回复"mgo" 免费下载使用