大家好,我是何三,独立开发者
最近AI Agent圈有个项目让我挺意外的——字节跳动开源的 DeerFlow 2.0,GitHub上已经冲到 57,900+ Star,fork超过7200次。
!DeerFlow 2.0](assets/paste_20260405_140204.png)
这个项目最初以"深度研究"框架的身份上线,社区跑了一段时间后,开发者们把它玩出了花样:数据管线、幻灯片、仪表盘、内容工作流……什么都有人折腾。
于是字节直接从零重写,把它升级成了一个超级Agent框架。v2.0和v1.0没有任何共享代码,完全推倒重来。
今天我们来聊聊这个项目到底做了什么,为什么值得关注。

为什么DeerFlow 2.0不一样?
市面上做AI Agent的项目不少,但大多数要么只是个聊天bot套了个工具调用,要么是个实验性质的原型。
DeerFlow不一样的地方在于:它给Agent配了一台完整的"电脑"。
这是什么意思?
普通的AI助手,你能让它搜个网、写个文案,但它没法真正"执行"任务。DeerFlow在沙箱里给每个任务分配了一个完整的执行环境——有文件系统、有命令行、能装包、能跑代码、能看图片、能写文件。
这不是模拟,是真实的Docker隔离环境。

举个例子:你让DeerFlow"分析Titanic数据集,找出影响生还率的关键因素,并生成可视化报告"。
一个普通Agent可能只能给你文字分析。但DeerFlow会在沙箱里真正安装pandas、matplotlib,写Python脚本,跑数据分析,生成图表,最后输出一个完整报告。
它不只是"说",它真的在"做"。
核心架构拆解
DeerFlow基于LangGraph和LangChain构建,核心模块可以分成六个部分:
1. Skills(技能系统)
技能是DeerFlow干活的基础单元。每个技能是一个结构化的能力模块——定义了工作流、最佳实践和参考资料。
内置技能包括: - 深度研究:多源信息搜索与整合 - 报告生成:结构化的研究报告输出 - 幻灯片创建:自动生成PPT - 网页制作:生成可访问的网页 - 图像/视频生成:多模态内容创作
但关键点在于可扩展。你可以添加自己的技能,替换内置的,或者把多个技能组合成复合工作流。技能是渐进式加载的——只有任务需要的时候才加载,不会一股脑全塞进上下文。
沙箱里的技能文件结构大概长这样:
/mnt/skills/
public/
📄 research/SKILL.md
📄 report-generation/SKILL.md
📄 slide-creation/SKILL.md
📄 web-page/SKILL.md
📄 image-generation/SKILL.md
custom/
📄 your-custom-skill/SKILL.md ← 你自己的
2. Sub-Agents(子Agent系统)
复杂任务很难一步到位。DeerFlow的做法是分解任务。
主Agent可以在飞行中动态派生子Agent。每个子Agent运行在独立的上下文里——有自己的工具、有自己的目标、有自己的终止条件。子Agent可以并行执行,完成后把结构化结果回报给主Agent,主Agent再把所有内容合成一份连贯的输出。
比如你让它做一个"2026年AI Agent趋势预测"的深度研究。它可能会同时派出十几个子Agent,每个负责研究不同角度——技术趋势、市场机会、竞争格局、投资风向——然后汇总成一份完整的研究报告。
3. Sandbox(沙箱执行环境)
前面反复提到了沙箱。这是DeerFlow和普通聊天机器人最本质的区别。
每个任务都会获得一个隔离的执行环境,里面有完整的文件系统视图:
/mnt/user-data/
├─ uploads/ ← 你上传的文件
├─ workspace/ ← Agent的工作目录
└─ outputs/ ← 最终交付物
Agent可以读文件、写文件、执行命令。当配置安全时,还能跑shell脚本。所有这些都在Docker容器里隔离运行。
沙箱支持三种部署模式: - 本地执行:直接在宿主机运行(适合开发) - Docker执行:在隔离容器中运行(推荐) - Kubernetes执行:通过Provisioner服务运行(适合生产)
4. Long-Term Memory(长期记忆)
大多数Agent健忘——对话一结束,它就把你忘了。
DeerFlow会记住。跨会话地记住你的偏好、你的技术栈、你的工作风格。你用得越多,它越了解你。
记忆数据存储在本地,始终在你控制之下。而且2.0版本做了去重优化——重复的偏好和上下文不会跨会话无限累积。
5. Tools(工具集)
内置工具集覆盖了日常需求:Web搜索、网页抓取、文件操作、命令执行。还支持通过MCP服务器和Python函数扩展自定义工具。
6. IM Channels(消息通道)
这个功能挺实用——DeerFlow支持从Telegram、Slack、飞书/Lark、WeCom等平台接收任务。
不需要公网IP,不需要额外配置,设置好token就能用。这意味着你可以在手机上随时随地给Agent派活儿。

快速上手
上手流程非常简单,克隆仓库后几步就能跑起来:
第一步:克隆并初始化
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make config # 生成配置文件
第二步:配置模型
编辑 config.yaml,至少配置一个模型。DeerFlow是模型无关的,支持任何实现了OpenAI兼容API的LLM:
models:
- name: gpt-4
display_name: GPT-4
use: langchain_openai:ChatOpenAI
model: gpt-4
api_key: $OPENAI_API_KEY
max_tokens: 4096
temperature: 0.7
# 也支持DeepSeek、Claude、Gemini等
- name: deepseek-v3
display_name: DeepSeek V3
use: langchain_openai:ChatOpenAI
model: deepseek-chat
api_key: $DEEPSEEK_API_KEY
base_url: https://api.deepseek.com/v1
第三步:设置API密钥
# 在.env文件中配置
OPENAI_API_KEY=your-key-here
第四步:Docker启动(推荐)
make docker-init # 拉取沙箱镜像(只需一次)
make docker-start # 启动所有服务
然后访问 http://localhost:2026 就能用了。
如果不想用Docker,也支持本地开发模式,但需要先安装Node.js 22+、pnpm等依赖。
模型推荐
DeerFlow官方推荐了 豆包-Seed-2.0-Code(字节自己的模型)、DeepSeek v3.2 和 Kimi 2.5 这三个模型来运行。
当然,GPT-4、Claude、Gemini这些都能用。甚至支持同时配置多个Provider,比如主用DeepSeek,某些任务切到GPT-4。
最佳体验需要模型具备: - 长上下文窗口(10万+ tokens)——深度研究和多步任务非常吃上下文 - 推理能力——复杂的任务分解和规划需要模型能"想清楚" - 多模态输入——图像理解、视频理解 - 工具调用——可靠地调用函数和输出结构化数据
Claude Code集成
DeerFlow还提供了一个很酷的技能:claude-to-deerflow。
装上这个技能后,你可以直接在Claude Code里给DeerFlow发任务、查看状态、管理线程——不需要离开Claude Code的终端环境。
npm install skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow
在Claude Code里直接用 /claudetodeerflow 命令就能交互了。
值得关注的几个点
MIT协议开源。这个很重要——意味着你可以自由使用、修改、商业化,没有法律风险。
InfoQuest集成。DeerFlow最新接入了字节Plus独立开发的智能搜索和爬取工具集InfoQuest,支持免费在线体验,不需要额外配置就能获得更好的搜索质量。
Python Client。DeerFlow可以作为嵌入式Python库使用,不需要跑完整的HTTP服务:
from deerflow.client import DeerFlowClient
client = DeerFlowClient()
response = client.chat("分析这份报告", thread_id="my-thread")
# 流式输出
for event in client.stream("hello"):
if event.type == "messages-tuple" and event.data.get("type") == "ai":
print(event.data["content"])
一些建议
如果你打算认真用DeerFlow,我有几个建议:
-
用Docker跑,别图省事用本地模式。沙箱隔离是核心能力,本地模式安全性不够。
-
选好模型。深度研究类任务,长上下文是刚需。如果你用token敏感的模型,很容易跑着跑着就超限了。
-
试试内置Demo。官方站 deerflow.tech 上有很多案例——从预测Agent趋势到基于小说生成视频,值得过一遍找找灵感。
-
安全第一。官方明确提醒:沙箱有命令执行、文件操作等高权限能力,默认应该部署在本地可信环境中。如果要在非可信环境部署,必须做好网络隔离、IP白名单、认证网关等安全措施。
-
v2.0和v1.0完全不同。如果你之前用过v1,不要指望配置能迁移。1.x分支还在维护,但活跃开发已经全部转移到2.0。
DeerFlow 2.0代表了AI Agent框架的一个方向:不是做一个更会聊天的bot,而是给AI一个真正的执行环境,让它从"建议者"变成"执行者"。
这个思路,比大多数Agent项目都走得更远。
本文使用 MGO 编辑并发布
关注"何三笔记",回复"mgo" 免费下载使用