开源推荐

其他

57000 Star，字节开源的DeerFlow 2.0，凭什么从深度研究进化成超级Agent？

发表于 2026年04月05日阅读 34 评论 0

大家好，我是何三，独立开发者

最近AI Agent圈有个项目让我挺意外的——字节跳动开源的 DeerFlow 2.0，GitHub上已经冲到 57,900+ Star，fork超过7200次。

!DeerFlow 2.0](assets/paste_20260405_140204.png)

这个项目最初以"深度研究"框架的身份上线，社区跑了一段时间后，开发者们把它玩出了花样：数据管线、幻灯片、仪表盘、内容工作流……什么都有人折腾。

于是字节直接从零重写，把它升级成了一个超级Agent框架。v2.0和v1.0没有任何共享代码，完全推倒重来。

今天我们来聊聊这个项目到底做了什么，为什么值得关注。

deerflow_cover

为什么DeerFlow 2.0不一样？

市面上做AI Agent的项目不少，但大多数要么只是个聊天bot套了个工具调用，要么是个实验性质的原型。

DeerFlow不一样的地方在于：它给Agent配了一台完整的"电脑"。

这是什么意思？

普通的AI助手，你能让它搜个网、写个文案，但它没法真正"执行"任务。DeerFlow在沙箱里给每个任务分配了一个完整的执行环境——有文件系统、有命令行、能装包、能跑代码、能看图片、能写文件。

这不是模拟，是真实的Docker隔离环境。

deerflow_01

举个例子：你让DeerFlow"分析Titanic数据集，找出影响生还率的关键因素，并生成可视化报告"。

一个普通Agent可能只能给你文字分析。但DeerFlow会在沙箱里真正安装pandas、matplotlib，写Python脚本，跑数据分析，生成图表，最后输出一个完整报告。

它不只是"说"，它真的在"做"。

核心架构拆解

DeerFlow基于LangGraph和LangChain构建，核心模块可以分成六个部分：

1. Skills（技能系统）

技能是DeerFlow干活的基础单元。每个技能是一个结构化的能力模块——定义了工作流、最佳实践和参考资料。

内置技能包括： - 深度研究：多源信息搜索与整合 - 报告生成：结构化的研究报告输出 - 幻灯片创建：自动生成PPT - 网页制作：生成可访问的网页 - 图像/视频生成：多模态内容创作

但关键点在于可扩展。你可以添加自己的技能，替换内置的，或者把多个技能组合成复合工作流。技能是渐进式加载的——只有任务需要的时候才加载，不会一股脑全塞进上下文。

沙箱里的技能文件结构大概长这样：

/mnt/skills/
  public/
    📄 research/SKILL.md
    📄 report-generation/SKILL.md
    📄 slide-creation/SKILL.md
    📄 web-page/SKILL.md
    📄 image-generation/SKILL.md
  custom/
    📄 your-custom-skill/SKILL.md  ← 你自己的

2. Sub-Agents（子Agent系统）

复杂任务很难一步到位。DeerFlow的做法是分解任务。

主Agent可以在飞行中动态派生子Agent。每个子Agent运行在独立的上下文里——有自己的工具、有自己的目标、有自己的终止条件。子Agent可以并行执行，完成后把结构化结果回报给主Agent，主Agent再把所有内容合成一份连贯的输出。

比如你让它做一个"2026年AI Agent趋势预测"的深度研究。它可能会同时派出十几个子Agent，每个负责研究不同角度——技术趋势、市场机会、竞争格局、投资风向——然后汇总成一份完整的研究报告。

3. Sandbox（沙箱执行环境）

前面反复提到了沙箱。这是DeerFlow和普通聊天机器人最本质的区别。

每个任务都会获得一个隔离的执行环境，里面有完整的文件系统视图：

/mnt/user-data/
  ├─ uploads/       ← 你上传的文件
  ├─ workspace/     ← Agent的工作目录
  └─ outputs/       ← 最终交付物

Agent可以读文件、写文件、执行命令。当配置安全时，还能跑shell脚本。所有这些都在Docker容器里隔离运行。

沙箱支持三种部署模式： - 本地执行：直接在宿主机运行（适合开发） - Docker执行：在隔离容器中运行（推荐） - Kubernetes执行：通过Provisioner服务运行（适合生产）

4. Long-Term Memory（长期记忆）

大多数Agent健忘——对话一结束，它就把你忘了。

DeerFlow会记住。跨会话地记住你的偏好、你的技术栈、你的工作风格。你用得越多，它越了解你。

记忆数据存储在本地，始终在你控制之下。而且2.0版本做了去重优化——重复的偏好和上下文不会跨会话无限累积。

5. Tools（工具集）

内置工具集覆盖了日常需求：Web搜索、网页抓取、文件操作、命令执行。还支持通过MCP服务器和Python函数扩展自定义工具。

6. IM Channels（消息通道）

这个功能挺实用——DeerFlow支持从Telegram、Slack、飞书/Lark、WeCom等平台接收任务。

不需要公网IP，不需要额外配置，设置好token就能用。这意味着你可以在手机上随时随地给Agent派活儿。

deerflow_02

快速上手

上手流程非常简单，克隆仓库后几步就能跑起来：

第一步：克隆并初始化

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make config    # 生成配置文件

第二步：配置模型

编辑 config.yaml，至少配置一个模型。DeerFlow是模型无关的，支持任何实现了OpenAI兼容API的LLM：

models:
  - name: gpt-4
    display_name: GPT-4
    use: langchain_openai:ChatOpenAI
    model: gpt-4
    api_key: $OPENAI_API_KEY
    max_tokens: 4096
    temperature: 0.7

  # 也支持DeepSeek、Claude、Gemini等
  - name: deepseek-v3
    display_name: DeepSeek V3
    use: langchain_openai:ChatOpenAI
    model: deepseek-chat
    api_key: $DEEPSEEK_API_KEY
    base_url: https://api.deepseek.com/v1

第三步：设置API密钥

# 在.env文件中配置
OPENAI_API_KEY=your-key-here

第四步：Docker启动（推荐）

make docker-init   # 拉取沙箱镜像（只需一次）
make docker-start  # 启动所有服务

然后访问 http://localhost:2026 就能用了。

如果不想用Docker，也支持本地开发模式，但需要先安装Node.js 22+、pnpm等依赖。

模型推荐

DeerFlow官方推荐了 豆包-Seed-2.0-Code（字节自己的模型）、DeepSeek v3.2 和 Kimi 2.5 这三个模型来运行。

当然，GPT-4、Claude、Gemini这些都能用。甚至支持同时配置多个Provider，比如主用DeepSeek，某些任务切到GPT-4。

最佳体验需要模型具备： - 长上下文窗口（10万+ tokens）——深度研究和多步任务非常吃上下文 - 推理能力——复杂的任务分解和规划需要模型能"想清楚" - 多模态输入——图像理解、视频理解 - 工具调用——可靠地调用函数和输出结构化数据

Claude Code集成

DeerFlow还提供了一个很酷的技能：claude-to-deerflow。

装上这个技能后，你可以直接在Claude Code里给DeerFlow发任务、查看状态、管理线程——不需要离开Claude Code的终端环境。

npm install skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow

在Claude Code里直接用 /claudetodeerflow 命令就能交互了。

值得关注的几个点

MIT协议开源。这个很重要——意味着你可以自由使用、修改、商业化，没有法律风险。

InfoQuest集成。DeerFlow最新接入了字节Plus独立开发的智能搜索和爬取工具集InfoQuest，支持免费在线体验，不需要额外配置就能获得更好的搜索质量。

Python Client。DeerFlow可以作为嵌入式Python库使用，不需要跑完整的HTTP服务：

from deerflow.client import DeerFlowClient

client = DeerFlowClient()
response = client.chat("分析这份报告", thread_id="my-thread")

# 流式输出
for event in client.stream("hello"):
    if event.type == "messages-tuple" and event.data.get("type") == "ai":
        print(event.data["content"])

一些建议

如果你打算认真用DeerFlow，我有几个建议：

用Docker跑，别图省事用本地模式。沙箱隔离是核心能力，本地模式安全性不够。
选好模型。深度研究类任务，长上下文是刚需。如果你用token敏感的模型，很容易跑着跑着就超限了。
试试内置Demo。官方站 deerflow.tech 上有很多案例——从预测Agent趋势到基于小说生成视频，值得过一遍找找灵感。
安全第一。官方明确提醒：沙箱有命令执行、文件操作等高权限能力，默认应该部署在本地可信环境中。如果要在非可信环境部署，必须做好网络隔离、IP白名单、认证网关等安全措施。
v2.0和v1.0完全不同。如果你之前用过v1，不要指望配置能迁移。1.x分支还在维护，但活跃开发已经全部转移到2.0。

DeerFlow 2.0代表了AI Agent框架的一个方向：不是做一个更会聊天的bot，而是给AI一个真正的执行环境，让它从"建议者"变成"执行者"。

这个思路，比大多数Agent项目都走得更远。

本文使用 MGO 编辑并发布

关注"何三笔记"，回复"mgo" 免费下载使用

版权声明：如无特殊说明，文章均为何三笔记原创，转载请注明出处

本文链接：https://www.h3blog.com/article/758/

为什么DeerFlow 2.0不一样？
核心架构拆解
快速上手
模型推荐
Claude Code集成
值得关注的几个点
一些建议