DeerFlow 调研笔记

January 1, 2020

本文为字节跳动开源的 DeerFlow（Deep Exploration and Efficient Research Flow）调研笔记。DeerFlow 是一个社区驱动的 Super Agent Harness，通过编排子智能体、记忆系统和沙箱来完成几乎任何任务。

开源地址：https://github.com/bytedance/deer-flow

官方网站：https://deerflow.tech

当前版本：2.0（2026 年全面重写，与 v1 不共享代码）

这篇文章说了什么

DeerFlow 是字节跳动开源的"超级智能体套件（Super Agent Harness）"。v1 定位是 Deep Research 框架（做深度研究、生成报告），v2 推倒重来后定位升级为通用 Agent 编排平台——Skill 化、插件化，号称"通过可扩展的 Skills 编排 sub-agents、记忆和沙箱来完成几乎任何任务"。

核心卖点：

完整的 Web UI：比纯 Python SDK 的框架多了开箱即用的前端，支持对话管理、文件预览、MCP 工具集成、播客生成
Skills 系统：把能力封装为可复用的 Skill，用户可以创建、分享、组合
多种部署模式：本地 dev、Docker、K8s 沙箱、火山引擎一键部署
16.6k Stars：社区活跃度很高

它和 DeepAgents 最大的区别：DeerFlow 更像一个产品（有 UI、有 Skills 商店的概念、有火山引擎的商业化路径），而 DeepAgents 更像一个开发框架（SDK + CLI + LangSmith 部署）。

观后感

DeerFlow v2 从"Deep Research"到"Super Agent Harness"的定位升级很聪明——Deep Research 赛道太卷了，通用 Agent 编排才是更大的市场
Skills 系统的设计思路值得学习：把 Agent 能力封装为可复用、可分享的技能单元
Web UI 是重要的差异化——很多 Agent 框架只有 SDK，非技术人员根本用不了
火山引擎的 Coding Plan 和一键部署说明字节是把它当云产品的获客工具在推
作为开源项目 16.6k Stars 说明社区认可度很高，但 v2 全面重写也意味着生态需要重建

一、项目概述与演进

1.1 从 v1 到 v2

维度	v1	v2
定位	Deep Research 框架	Super Agent Harness（通用 Agent 编排）
代码	基于 LangGraph 的研究工作流	全面重写，不共享代码
核心能力	搜索 + 爬虫 + Python 执行 → 研究报告	Skills 驱动的多 Agent 编排 + 沙箱 + 记忆
UI	控制台 + Web UI	完整 Web UI（对话管理、文件预览、MCP）
部署	pip install + 配置文件	Docker / 本地 / K8s / 火山引擎一键部署

v1 仍然在 main-1.x 分支维护，但活跃开发已转向 v2。

1.2 技术栈

DeerFlow 2.0
    ├── 后端：Python 3.12+ / LangGraph / uv
    ├── 前端：Node.js 22+ / Next.js / pnpm
    ├── 沙箱：Docker / K8s（provisioner 模式）
    ├── 部署：Docker Compose / 火山引擎 FaaS / Nginx
    └── 追踪：LangSmith / Langfuse

二、核心能力

2.1 Skills 系统

DeerFlow 最核心的设计：把 Agent 能力封装为可复用的 Skills。

一个 Skill 包含：

Instructions：告诉 Agent 这个技能是干什么的、怎么用
Tools：技能需要的工具集（搜索、爬虫、代码执行等）
Context：技能相关的领域知识

# Skill 示例（概念示意）
name: research-report
description: 深度研究并生成结构化报告
instructions: |
  1. 先搜索收集信息
  2. 生成大纲
  3. 逐节撰写
  4. 生成最终报告
tools: [web_search, web_crawl, python_execute]

Skills 可以：

用户自己创建
从社区分享中获取
在对话中动态切换（不同的 Skill 对应不同的工作模式）

2.2 Sub-Agents（子智能体）

DeerFlow 的核心编排单位是 Sub-Agent。一个复杂任务会被拆解为多个子 Agent 并行或串行执行。

与 DeepAgents 的 task 工具类似，但 DeerFlow 更强调 Skills 驱动的子 Agent：每个子 Agent 可以加载不同的 Skill，相当于"给不同的工人分配不同的工具箱"。

2.3 沙箱与文件系统

三种执行模式：

模式	说明	适用场景
Local Execution	直接在宿主机执行代码	开发测试
Docker Execution	在隔离容器中执行	生产安全
K8s Execution	通过 provisioner 在 K8s Pod 中执行	大规模多租户

沙箱提供了 Agent 操作文件系统和执行 Python 代码的安全环境。结合文件上传功能，Agent 可以分析 PDF、处理 CSV 数据、生成图表。

2.4 上下文工程

DeerFlow 的上下文管理策略：

对话摘要：长对话自动压缩早期消息
文件系统卸载：大内容写入文件系统，不在对话中堆积
子 Agent 隔离：每个子 Agent 独立上下文，只回传结果

2.5 长期记忆

支持跨对话的持久化记忆。Agent 可以记住用户偏好、之前的讨论内容、学到的经验。存储支持本地文件和数据库两种模式。

三、MCP 协议与工具集成

3.1 MCP Server 支持

DeerFlow 深度集成了 MCP（Model Context Protocol），支持：

HTTP/SSE MCP Servers：连接外部工具服务
OAuth Token Flow：client_credentials 和 refresh_token 授权
动态工具发现：Agent 自动获取 MCP Server 提供的工具列表

3.2 搜索引擎

支持多种搜索后端：

搜索引擎	类型	需要 API Key
Tavily	AI 专用搜索 API	需要
InfoQuest	BytePlus 自研（推荐）	需要
DuckDuckGo	隐私搜索引擎	不需要
Brave Search	隐私搜索引擎	需要
Arxiv	学术论文搜索	不需要
Searx/SearxNG	自托管元搜索引擎	需要自建

3.3 Claude Code / Codex 集成

v2 支持 CLI 驱动的模型提供者（Claude Code OAuth、Codex CLI），可以在 DeerFlow 中使用这些 CLI 工具背后的模型：

models:
  - name: claude-sonnet-4.6
    use: deerflow.models.claude_provider:ClaudeChatModel
    model: claude-sonnet-4-6
  - name: gpt-5.4
    use: deerflow.models.openai_codex_provider:CodexChatModel
    model: gpt-5.4

四、架构设计

4.1 启动模式

DeerFlow 支持多种启动模式组合：

模式	进程数	特点
Standard（Dev）	4 进程	前端 + Gateway + LangGraph + Nginx，支持热重载
Standard（Prod）	4 进程	同上但使用预构建前端
Gateway（Dev）	3 进程	Gateway 内嵌 Agent 运行时，不需要独立 LangGraph Server
Gateway（Prod）	3 进程	生产环境的 Gateway 模式

4.2 Standard vs Gateway 模式

Gateway 模式是 v2 的一个重要创新——把 Agent 运行时嵌入到 Gateway API 中：

维度	Standard Mode	Gateway Mode
架构	Gateway (REST) + LangGraph (Agent Runtime) 分离	Gateway 内嵌 Agent Runtime
进程数	4	3
并发控制	`--n-jobs-per-worker`（需要 license）	`--workers` × async tasks（无限制）
LangGraph 许可证	生产需要	不需要
资源占用	更高（两个 Python 运行时）	更低

4.3 部署模式

部署方式	命令	适用场景
本地开发	`make dev`	开发调试
Docker 开发	`make docker-start`	热重载 + 沙箱隔离
Docker 生产	`make up`	生产环境
火山引擎 FaaS	一键部署链接	免运维

五、Web UI 体验

DeerFlow 的 Web UI 是相比纯 SDK 框架最重要的差异化优势：

5.1 对话管理

多对话支持，会话历史持久化
对话模式切换：Default / Plan Mode / Skill Mode
模型动态切换（对话中可以换模型）

5.2 文件系统

可视化文件浏览器（Agent 创建的文件直接预览）
文件上传（PDF、CSV、代码等）
Agent 生成的文件直接下载

5.3 MCP 工具管理

Settings 页面可视化配置 MCP Server
工具状态实时显示
连接测试

5.4 Skills 管理

创建、编辑、删除 Skills
Skills 市场/社区（规划中）
对话中动态加载 Skill

5.5 其他功能

播客生成：基于研究报告自动生成播客音频（TTS 集成）
IM 集成：支持飞书等 IM 渠道
播客回放：历史对话可回放
通知：浏览器通知

六、企业级部署

6.1 部署规模建议

场景	最低配置	推荐配置
本地开发	4 vCPU, 8 GB RAM, 20 GB SSD	8 vCPU, 16 GB RAM
Docker 开发	4 vCPU, 8 GB RAM, 25 GB SSD	8 vCPU, 16 GB RAM
生产服务器	8 vCPU, 16 GB RAM, 40 GB SSD	16 vCPU, 32 GB RAM

6.2 Docker 部署

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make setup          # 交互式配置向导
make docker-init    # 拉取沙箱镜像
make docker-start   # 启动服务
# 访问 http://localhost:2026

6.3 火山引擎一键部署

DeerFlow 已入驻火山引擎 FaaS 应用中心，支持一键部署。这是字节跳动把开源项目转化为云产品获客的标准路径。

6.4 安全注意

官方明确警告：不当部署可能引入安全风险（Agent 有 shell 执行和文件系统访问能力）。建议：

使用沙箱模式（Docker/K8s）隔离执行环境
不要暴露到公网而不做鉴权
生产环境使用 Gateway 模式并配置认证

七、推荐模型

字节官方推荐用于 DeerFlow 的模型：

模型	推荐理由
Doubao-Seed-2.0-Code	字节自家的代码模型，深度优化
DeepSeek v3.2	性价比最高的开源推理模型
Kimi 2.5	中文能力优秀
Claude Sonnet 4.6	闭源天花板，tool calling 最稳定

八、与 DeepAgents 的对比

维度	DeerFlow	DeepAgents
开发者	字节跳动	LangChain
定位	Super Agent Harness（产品化）	Agent Harness（开发框架）
Web UI	✅ 完整前端	❌ 仅 CLI
Skills 系统	✅ 封装为可复用 Skill	✅ Skills Middleware
子 Agent	Sub-agents + Skills 驱动	`task` 工具 spawn
沙箱	Docker / K8s / 本地	StateBackend / Sandbox / 本地
MCP	✅ 深度支持	✅ langchain-mcp-adapters
记忆系统	持久化记忆	LangGraph Store
部署	Docker / 火山引擎	LangSmith Deploy
社区	16.6k Stars	15k+ Stars
许可证	MIT	MIT
适合谁	需要开箱即用产品 + Web UI 的团队	需要编程式 Agent SDK 深度定制的开发者

九、生态与商业模式

DeerFlow 的开源-商业路径：

开源引流：MIT 许可证 + 16.6k Stars 建立社区认知
火山引擎集成：InfoQuest（搜索 API）、FaaS 一键部署、Coding Plan
Skills 生态：社区 Skills 创造网络效应
企业版：推测未来会有付费的增强功能（更大规模的多租户、更强大的审计等）

十、核心经验总结

v2 全面重写的勇气值得学习：不破不立，v1 的 Deep Research 定位太窄，v2 的 Super Agent Harness 定位打开了更大市场
Skills 系统是 Agent 平台的"App Store"：让非编程用户也能创建和分享 Agent 能力，降低使用门槛
Web UI 是框架到产品的关键一步：再好的 SDK 也只能服务开发者，Web UI 能服务所有知识工作者
Gateway 模式解决了 LangGraph 的 license 问题：不用 LangGraph Platform Server 也能做到生产可用的并发和稳定性
MCP 协议正在成为 Agent 工具的通用连接标准：两个框架都深度支持 MCP，这个趋势不可忽视
字节做开源的风格是"用开源养云"：DeerFlow 免费好用，但火山引擎的 InfoQuest、FaaS 部署都在同一个生态里

这篇文章说了什么​

观后感​

一、项目概述与演进​

1.1 从 v1 到 v2​

1.2 技术栈​

二、核心能力​

2.1 Skills 系统​

2.2 Sub-Agents（子智能体）​

2.3 沙箱与文件系统​

2.4 上下文工程​

2.5 长期记忆​

三、MCP 协议与工具集成​

3.1 MCP Server 支持​

3.2 搜索引擎​

3.3 Claude Code / Codex 集成​

四、架构设计​

4.1 启动模式​

4.2 Standard vs Gateway 模式​

4.3 部署模式​

五、Web UI 体验​

5.1 对话管理​

5.2 文件系统​

5.3 MCP 工具管理​

5.4 Skills 管理​

5.5 其他功能​

六、企业级部署​

6.1 部署规模建议​

6.2 Docker 部署​

6.3 火山引擎一键部署​

6.4 安全注意​

七、推荐模型​

八、与 DeepAgents 的对比​

九、生态与商业模式​

十、核心经验总结​