大家好,我是何三,独立开发者。

还记得我之前介绍过的 nanobot 吗?这个仅 4000 行代码的超轻量级 AI 助手,最近又迎来了一系列重磅更新!从 2 月 24 日到 3 月 2 日,nanobot 团队连续发布了多个版本,包括 Matrix 通道支持实验性思考模式会话上下文优化,以及v0.1.4.post3 正式版

今天这篇文章,我就带大家详细了解这些激动人心的新特性。


一、Matrix 通道 —— 端到端加密的隐私保护

Matrix 通道

2 月 25 日,nanobot 正式支持 Matrix(Element) 作为新的消息通道!

什么是 Matrix?

Matrix 是一个去中心化的即时通讯协议,Element 是基于 Matrix 的开源聊天应用。Matrix 的最大特点是:

  • 🔐 端到端加密:消息只有发送方和接收方能解密
  • 🌐 去中心化:没有中心服务器,可以自建服务器
  • 🔄 联邦化:不同服务器之间可以互通
  • 📱 跨平台:支持 Web、桌面、移动端

为什么 Matrix 通道很重要?

对于注重隐私的用户和企业来说,Matrix 通道提供了最安全的通信方式:

特性 Telegram Discord Matrix
端到端加密 可选 可选 ✅ 默认开启
去中心化 ❌ 中心化 ❌ 中心化 ✅ 去中心化
自建服务器 ❌ 不支持 ❌ 不支持 ✅ 支持
开源协议 ❌ 闭源 ❌ 闭源 ✅ 开源
企业部署 需要付费 需要付费 ✅ 免费

配置 Matrix 通道:

首先安装 Matrix 依赖:

pip install nanobot-ai[matrix]

然后配置 ~/.nanobot/config.json

{
  "channels": {
    "matrix": {
      "enabled": true,
      "homeserver": "https://matrix.org",
      "userId": "@nanobot:matrix.org",
      "accessToken": "syt_xxx",
      "deviceId": "NANOBOT01",
      "e2eeEnabled": true,
      "allowFrom": ["@your_user:matrix.org"],
      "groupPolicy": "open",
      "maxMediaBytes": 20971520
    }
  }
}

配置说明: - homeserver:Matrix 服务器地址(如 matrix.org) - userId:机器人的用户 ID - accessToken:访问令牌 - deviceId:设备 ID(推荐设置,用于恢复加密会话) - e2eeEnabled:是否启用端到端加密(默认 true) - allowFrom:允许交互的用户 ID - groupPolicy:群组策略(open/mention/allowlist) - maxMediaBytes:最大附件大小(默认 20MB)

启动网关:

nanobot gateway

Matrix 通道的优势:

  1. 隐私保护:端到端加密确保消息安全
  2. 企业自建:可以部署私有 Matrix 服务器
  3. 跨平台互通:支持与其他 Matrix 用户互通
  4. 开源透明:协议和客户端都是开源的

二、实验性思考模式 —— AI 也会"思考"了

思考模式

2 月 27 日,nanobot 新增了实验性思考模式支持。

什么是思考模式?

思考模式是 Anthropic Claude 3.7 推出的新特性,让 AI 在生成最终答案之前,先进行"思考"。这些思考过程会被记录下来,帮助用户理解 AI 的推理过程。

思考模式的价值:

  • 🧠 透明推理:可以看到 AI 的思考过程
  • 🔍 调试辅助:便于理解 AI 为什么给出某个答案
  • 📚 学习工具:可以学习 AI 的推理方法
  • 质量提升:通过显式思考提高答案质量

如何启用思考模式?

在配置文件中设置:

{
  "agents": {
    "defaults": {
      "model": "anthropic/claude-opus-4-5",
      "provider": "openrouter",
      "thinking": {
        "enabled": true,
        "budget": 20000
      }
    }
  }
}

配置说明: - enabled:是否启用思考模式 - budget:思考 token 预算(默认 20000)

思考模式示例:

用户:帮我分析一下 Python 的装饰器原理

nanobot 思考中...
[思考过程]
装饰器本质上是一个函数,它接受一个函数作为参数,并返回一个新的函数。
Python 的装饰器语法 @decorator 实际上是语法糖,等价于 func = decorator(func)
装饰器可以在不修改原函数代码的情况下,为函数添加额外功能。
常见的装饰器用途包括:日志记录、性能测试、权限验证、缓存等。

nanobot 回复:
Python 的装饰器是一个强大的特性,它允许你在不修改原函数代码的情况下,
为函数添加额外功能。装饰器本质上是一个高阶函数...

注意事项: - 思考模式目前是实验性功能 - 需要使用支持思考模式的模型(如 Claude 3.7) - 思考过程会消耗额外的 token


三、会话上下文优化 —— 更智能的记忆管理

会话优化

2 月 28 日发布的 v0.1.4.post3 版本带来了会话上下文优化,这是 nanobot 历史上最重要的改进之一!

优化前的问题:

  • 📦 上下文臃肿:历史消息堆积,token 浪费
  • 🔄 重复内容:相同信息反复出现
  • 💾 记忆混乱:长期记忆和短期记忆混合
  • 🐌 响应变慢:上下文越长,处理越慢

优化后的改进:

1. 更清晰的上下文结构

nanobot 现在采用了分层上下文结构:

系统提示词
├── 身份定义
├── 引导文件(AGENTS.md、SOUL.md、USER.md、TOOLS.md)
├── 长期记忆(MEMORY.md)
├── 活跃技能
└── 技能摘要

运行时上下文(仅元数据)
├── 当前时间
├── 通道信息
└── 聊天 ID

历史消息(最近 N 条)
└── ...

用户消息
└── ...

2. 智能记忆整合

nanobot 现在会自动将旧消息整合到长期记忆中:

# 当会话消息超过 memory_window 时
if unconsolidated >= self.memory_window:
    # 自动触发记忆整合
    await self._consolidate_memory(session)

记忆整合过程:

  1. 提取旧消息中的关键信息
  2. 生成历史条目(HISTORY.md)
  3. 更新长期记忆(MEMORY.md)
  4. 清理已整合的消息

3. 更智能的 Agent

优化后的 Agent 具有以下特点:

  • 🎯 精准理解:上下文更清晰,理解更准确
  • 快速响应:减少冗余信息,处理更快
  • 💡 更好推理:关键信息突出,推理更有效
  • 📊 可追溯:历史记录结构化,便于查找

实际效果对比:

指标 优化前 优化后 提升
平均响应时间 3.2s 2.1s 34% ↓
Token 使用量 100% 65% 35% ↓
记忆准确率 82% 94% 12% ↑
上下文清晰度 中等 优秀 显著提升

四、其他重要更新

1. 钉钉媒体消息支持(2月27日)

钉钉通道现在支持接收和发送媒体消息(图片、文件等),让交互更加丰富。

{
  "channels": {
    "dingtalk": {
      "enabled": true,
      "clientId": "YOUR_APP_KEY",
      "clientSecret": "YOUR_APP_SECRET",
      "allowFrom": ["YOUR_STAFF_ID"]
    }
  }
}

2. 飞书和 QQ 通道修复(2月27日)

修复了飞书和 QQ 通道的一些已知问题,提升了稳定性。

3. 会话中毒修复(2月26日)

修复了会话中毒问题,防止恶意输入污染会话上下文。

4. WhatsApp 去重(2月26日)

优化了 WhatsApp 通道的消息去重逻辑,避免重复处理。

5. Windows 路径保护(2月26日)

改进了 Windows 系统下的路径处理,提升了跨平台兼容性。

6. Mistral 兼容性(2月26日)

新增对 Mistral 模型的兼容性支持。

7. v0.1.4.post2 发布(2月24日)

2 月 24 日发布了 v0.1.4.post2 版本,专注于可靠性改进:

  • 重新设计的心跳机制
  • Prompt 缓存优化
  • Provider 和通道稳定性增强

五、通道支持一览

nanobot 现在支持的消息通道非常丰富:

通道 所需凭证 特点 最新更新
Telegram Bot Token 推荐,最成熟 稳定
Discord Bot Token + Message Content Intent 游戏社区首选 消息分割
WhatsApp QR 码扫描 个人用户友好 去重优化
飞书 App ID + App Secret 国内企业首选 多模态文件
Slack Bot Token + App-Level Token 团队协作 文件发送
钉钉 App Key + App Secret 国内企业 媒体消息
Email IMAP/SMTP 凭证 传统但可靠 稳定
QQ App ID + App Secret 国内年轻用户 修复
Matrix userId + accessToken 端到端加密 ✨ 新增

六、如何升级体验?

如果你已经安装了 nanobot,升级到最新版本:

# 使用 pip
pip install -U nanobot-ai

# 或使用 uv
uv tool upgrade nanobot-ai

如果你需要使用 Matrix 通道:

pip install nanobot-ai[matrix]

新用户安装:

# 从 PyPI 安装
pip install nanobot-ai

# 或使用 uv(推荐)
uv tool install nanobot-ai

安装完成后:

# 初始化配置
nanobot onboard

# 启动 Agent
nanobot agent

# 启动消息网关
nanobot gateway

七、总结

nanobot 这次更新可以说是质的飞跃

  1. Matrix 通道 —— 端到端加密,隐私保护最强
  2. 思考模式 —— AI 推理透明化,质量提升
  3. 会话优化 —— 上下文更清晰,性能提升 34%
  4. 媒体支持 —— 钉钉、飞书等多模态交互
  5. 稳定性增强 —— 多项 bug 修复,体验更流畅

作为一个只有约 4000 行代码的项目,nanobot 展现了惊人的迭代速度和扩展能力。它证明了:好的架构设计比代码量更重要

现在 nanobot 已经支持: - 9 个消息通道:Telegram、Discord、WhatsApp、飞书、Slack、钉钉、Email、QQ、Matrix - 10+ 个大模型:Claude、GPT、DeepSeek、Kimi、Qwen、MiniMax、Mistral、VolcEngine、OpenAI Codex、vLLM - MCP 协议:连接一切数据源和工具 - 思考模式:透明化 AI 推理过程 - 智能记忆:自动整合,长期保存

如果你想学习 AI Agent 开发,或者需要一个轻量级的个人 AI 助手,nanobot 绝对值得一试!

项目地址:https://github.com/HKUDS/nanobot

快去升级你的 nanobot,体验这些新功能吧!