增长工程师最佳实践:用工程手段驱动业务增长
核心观点:增长工程师是专注于直接驱动业务指标(注册量、转化率、留存率、收入)的工程师角色。本文从「是什么→怎么做→怎么组织→避什么坑」四个层面展开。第一层(是什么):增长工程师不追求构建完美系统,而是通过快速实验、数据驱动决策和持续迭代来发现增长机会。第二层(怎么做):六大核心实践——建立实验基础设施、ICE 优先级排序、Feature Flags + A/B 测试、North Star Metric + OKR 体系、增长闭环、系统化实验流程。第三层(怎么组织):三种团队模型(独立/嵌入式/混合)和五种关键角色。第四层(避什么坑):六大常见误区和对应的规避策略。
快速开始:30 分钟搞懂增长工程师
全文知识图谱
增长工程师的一天
核心增长闭环
如果你只有 5 分钟
直接看这张表:
| 你想解决的问题 | 跳到哪一节 | 核心动作 |
|---|---|---|
| 我不确定我们是否准备好做增长 | 实践 1(Alexey Test) | 先过一遍 11 条标准 |
| 实验想法太多,不知道先做哪个 | 实践 2(ICE 排序) | 每个想法打 ICE 分 |
| 想快速验证假设但怕影响线上用户 | 实践 3(Feature Flags) | 上一个 Feature Flag 平台 |
| 团队目标分散,各干各的 | 实践 4(North Star) | 先定义一个北极星指标 |
| 增长做完就完了,没有积累 | 实践 5(增长闭环) | 把线性漏斗变成闭环 |
| 实验流程混乱,结果不可信 | 实践 6(7 步流程) | 严格执行 7 步实验法 |
| 不知道怎么搭建增长团队 | 第三章(团队结构) | 根据公司阶段选模型 |
| 怕踩坑 | 第五章(误区指南) | 对照 6 条逐一排查 |
一、增长工程师是什么
先搞清楚一个前提:增长工程师不是"会写代码的运营",也不是"做增长的程序员"。它是一个独立的角色,核心特征是用工程手段直接驱动业务增长指标。
1.1 一句话说清楚
传统软件工程师像公交车司机,沿着产品路线图把功能一站一站地送到。增长工程师像出租车司机,在各个实验之间跳来跳去,积累一个个小胜利。
"Engineers are like bus drivers, helping move a product along its roadmap. Growth engineers are like taxi drivers, bouncing from experiment to experiment stacking little wins." — How to think like a growth engineer (PostHog)
1.2 和传统工程师的核心区别
| 维度 | 传统软件工程师 | 增长工程师 |
|---|---|---|
| 核心追求 | 稳定性、正确性、可维护性 | 探索、发现、快速验证 |
| 工作方式 | 按需求开发功能 | 按假设设计实验 |
| 对代码的态度 | 每一行都要经得起考验 | 实验可能失败被删掉,先交付"够用"的版本 |
| 对依赖的态度 | 先充分评估再引入 | 先引入来加速测试 |
| 失败观 | 失败意味着 Bug、宕机 | 失败是日常工作的一部分,80-90% 的实验都会"失败" |
| 指标意识 | 关注技术指标(性能、可用性) | 关注业务指标(转化率、留存率、收入) |
来源:What is a growth engineer? (PostHog) | LinkedIn: Growth vs Software Engineer
1.3 什么样的人适合做增长工程师
PostHog 的经验是:前技术创始人特别适合这个角色。因为他们同时具备技术、产品和商业思维。
具体来说,增长工程师需要四方面的特质:
| 特质 | 说明 | 为什么重要 |
|---|---|---|
| 创业心态 | 独立、灵活、不挑活、有好奇心 | 增长工程师经常需要"孤狼"式工作,自己端到端负责 |
| 实验思维 | 假设驱动、迭代优先、实用主义 | 不执着于完美方案,而是找到有效方案 |
| 数据敏感 | 能构建假设、计算统计显著性、评估结果 | 所有决策都以数据为基础 |
| 跨域能力 | 工程能力 + 产品感 + 设计判断 + 商业理解 | 增长工程师需要独立做出产品和设计决策 |
来源:What is a growth engineer? (PostHog) | Growth Engineering: 6 Must-Have Mindset Traits (LinkedIn)
Takeaway:增长工程师的本质不是某个技术栈,而是一套思维模式——数据驱动、实验优先、拥抱失败、跨领域协作。
二、六大核心实践
实践 1:建立坚实的实验基础设施
在增长工程领域,有一套著名的评估标准叫 The Alexey Test(来自前 MasterClass 增长工程负责人 Alexey Komissarouk),用 11 个问题评估一个增长工程环境是否成熟:
| # | 评估标准 | 理想状态 | 不及格信号 |
|---|---|---|---|
| 1 | A/B 测试基础设施 | 正规的实验平台(GrowthBook、Statsig 等) | 还在用 userId mod 100 做分组 |
| 2 | 代码库对实验友好 | 有 getExperimentVariant() 辅助函数、React 组件包装器 | 每次实验都要从零搭轮子 |
| 3 | 部署速度 | 每日或持续部署 | 代码从完成到上线要等一个月 |
| 4 | 质量工具 | Error Boundary、自动化测试、监控告警 | 实验出错导致整页 500 |
| 5 | 实验结果看板 | 支持按多维度切割分析 | 每次实验都要重新写 SQL |
| 6 | 实验纪律 | 不偷看结果、holdout 组、控制胜者诅咒 | 高管随时要求看中间结果 |
| 7 | 工程师对数据栈的参与度 | 工程师能自助查询用户行为数据 | "数据的事找分析师" |
| 8 | 实验想法来源 | 工程师充当 mini-PM,贡献想法 | PM 独占所有实验想法 |
| 9 | 实验吞吐量 | 每两周上线一个实验 | 一个季度才上一个实验 |
| 10 | 公司是否准备好了 | 已有 PMF(产品市场契合)和足够流量 | "增长不行,搞个增长团队吧" |
| 11 | 团队指标自主权 | 团队有权完全自主推动自己负责的指标 | 需要跨团队"搭便车"写代码 |
关键洞察:第 10 条特别重要。没有 PMF 就开始做增长,等于在加速卖一个用户不想要的产品。
来源:The Alexey Test: 11 steps to better Growth Engineering
Takeaway:增长工程不是有个人就能做的。基础设施、团队文化、公司阶段,三者缺一不可。先评估环境,再谈增长。
实践 2:用 ICE/RICE 框架排序优先级
增长团队永远不会缺少实验想法,但资源永远有限。所以优先级排序是增长工程师最核心的能力之一。
ICE 框架(最常用):
| 维度 | 含义 | 评估方式 |
|---|---|---|
| I = Impact | 对 North Star 指标的预期影响 | 高/中/低打分 |
| C = Confidence | 对实验成功的信心水平 | 基于数据还是直觉? |
| E = Ease | 构建和运行需要多少努力 | 工程时间、成本估算 |
三个维度各打 1-10 分,总分越高越优先。简单、粗暴、有效。
进阶版本:
- ICE-R:加入可扩展性(Reach)维度
- PXL Framework(ConversionXL 开发):引入更多客观性评估,避免纯主观打分
实验文档化模板应包含:
- 假设描述 → 预期运行时长 → 构建工具 → 实验成本 → 学习总结
来源:Growth Experiments Framework | Ultimate Growth Experimentation Framework | Growth Experiment Framework (Hangryfeed)
Takeaway:不要凭感觉决定做什么实验。用 ICE 框架打分,让优先级排序有据可依。
实践 3:Feature Flags + A/B 测试的组合拳
Feature Flags(功能开关)是增长工程的核心工具。它把代码部署和功能发布解耦,让增长团队可以快速实验而不影响所有用户。
Feature Flags 带来的五个能力:
| 能力 | 说明 | 实际场景 |
|---|---|---|
| 灰度发布 | 先给 5% 用户看新功能,再逐步放量 | 新注册流程先给小部分用户测试 |
| 定向测试 | 只对特定用户群开启功能 | "只对北美付费流量跑这个实验" |
| 即时开关 | 不发版就能开启/关闭实验 | 实验出问题,一键回滚 |
| 并发实验 | 多个实验同时跑互不干扰 | 注册团队和支付团队同时做实验 |
| 内部测试 | 先在内部验证再面向用户 | 工程师自己先体验实验的两个变体 |
推荐工具栈:
| 工具 | 特点 | 适合场景 |
|---|---|---|
| GrowthBook | 开源,支持多种统计方法 | 预算有限的团队 |
| Statsig | 仓内原生分析,Knowledge Graph | 需要 code→experiment→metric 闭环 |
| Optimizely | 成熟稳定,Full Stack 方案 | 企业级需求 |
| Unleash | 开源,部署灵活 | 对数据安全有高要求 |
| PostHog | 开源,分析+flags 一体 | 产品分析+实验一体化 |
来源:Feature Flags for Experimentation (ConfigCat) | Feature Flags accelerate A/B Testing (Unleash) | GrowthBook A/B Testing | Feature Flag Tools (Amplitude)
Takeaway:Feature Flags 不是"锦上添花",而是增长工程的基础设施。没有它,快速实验就是空谈。
实践 4:定义 North Star Metric + OKR 体系
增长团队需要一个北极星指标来对齐所有人的方向。
什么是 North Star Metric? 它是反映产品为客户创造价值的那一个核心指标。不是收入,不是用户数,而是最能代表产品价值的那个数字。
| 公司类型 | North Star Metric 示例 |
|---|---|
| Spotify | 用户收听时长 |
| 用户发送消息数 | |
| Airbnb | 预订夜晚数 |
| Slack | 团队发送消息数 |
| Notion | 创建的活跃 workspace 数 |
OKR 怎么和 North Star 结合?
- 每个季度制定 1 个 Objective + 3-4 个 Key Results
- Key Results 同时包含领先指标(预测未来)和滞后指标(确认结果)
- North Star Metric 可以作为公司级 OKR 的一部分
两个关键原则:
- 指标的 scope 必须和团队的 scope 匹配。一个负责注册转化率的团队,不应该背"总收入"这个指标——季节性波动(比如礼品类产品圣诞节暴涨一月暴跌)和组织边界(跨团队协作成本极高)会让团队很痛苦。
- 指标要由 unbiased 的第三方来"打分"。如果团队自己评估自己的实验结果,迟早会自欺欺人。
来源:How to Win With OKRs and North Star | North Star Metric (Product School) | OKR Framework for Scaling Startups
Takeaway:没有 North Star 的增长团队就像没有指南针的船。先定义一个指标,再围绕它做实验。
实践 5:构建增长闭环
现代增长理论强调从线性漏斗转向闭环系统。线性漏斗是"进一漏一",闭环是"越转越快"。
六种常见增长闭环:
| 闭环类型 | 运作机制 | 典型案例 |
|---|---|---|
| 推荐闭环 | 用户喜爱产品后主动分享 | DropBox 邀请好友送空间 |
| UGC 闭环 | 用户创作内容吸引新用户 | 小红书用户种草笔记 |
| 病毒闭环 | 一个分享行为引发连锁反应 | TikTok 视频传播 |
| 协作闭环 | 用户邀请他人一起使用 | Notion 团队协作空间 |
| 产品使用闭环 | 一个用户的参与带动其他用户 | Slack 群聊活跃度 |
| 市场闭环 | 更多卖家吸引更多买家 | 淘宝双边市场 |
PLG(Product-Led Growth)飞轮:
每个阶段的用户行为都在驱动增长:Champions 推荐新用户(获客),Regulars 尝试新功能(留存),Explorers 提供反馈(改进)。
来源:Growth Team Structure (Product School) | PLG Guide (Amplitude) | Building a PLG Team (ProductLed)
Takeaway:如果你只在想"怎么让漏斗的每一步转化率高一点",你做的是线性增长。开始想"怎么让用户的每个行为都为增长注入动力",你做的是指数增长。
实践 6:系统化的实验流程(7 步法)
不是随便改个按钮颜色就叫实验。增长工程师有一套标准流程:
第 1 步:识别目标领域
找到有改善空间的产品区域。比如 PostHog 的增长团队发现"产品分析"和"数据仓库"功能升级了,但引导流程没跟上,这就是一个目标。
第 2 步:定义代表指标
选择一个能量化改善的指标。比如"新组织激活率"(创建仪表盘 + 分析洞察 + 邀请队友的综合比例)。
第 3 步:创建假设
基于数据形成可验证的假设。比如"在引导流程中加入仪表盘模板,可以提高激活率"。
第 4 步:最小化实验实现
用最小成本测试假设。经典方法是 Fake Door Test(假门测试)。
MasterClass 案例:他们想测试分层定价,但没有真正构建分层功能。做法是让用户选择喜欢的层级,结账时告诉他们被"免费升级"到最好的层级(实际是现有统一定价)。这个测试节省了数月工程时间。
第 5 步:确保样本量足够
达到统计显著性,确保你的结果不是随机波动。
第 6 步:运行足够时长
至少 1 周(覆盖工作日和周末的不同使用模式),不超过 1 个月(避免延迟重要变更的上线)。
第 7 步:分析并文档化学习
无论成功失败都记录洞察。实验失败不代表浪费时间——Google 80-90% 的实验都"失败"了,但一个 Bing 标题显示实验带来的 12% 收入增长(超过 $100M),足以覆盖所有失败的成本。
来源:7-Step Experimentation Framework (Amplitude) | How to think like a growth engineer | A Complete Guide to Growth Experimentation (Ikaros)
Takeaway:实验不是"改个东西看看效果",而是一套从假设到验证到学习的完整流程。纪律性比创意更重要。
三、团队结构与组织
3.1 三种常见模型
| 模型 | 特点 | 适用场景 | 典型案例 |
|---|---|---|---|
| 独立团队 | 独立的 PM + 数据 + 设计 + 工程,"公司内的小创业公司" | 大公司,有资源和高层支持 | |
| 嵌入式 | 增长专家嵌入核心产品团队,拥有特定指标 | 需要与产品团队紧密协作 | Airbnb |
| 混合式 | 中央团队定策略和框架,嵌入成员负责执行 | 大型组织 | Dropbox、Pinterest |
3.2 公司案例
Facebook:最早的独立增长团队,拥有自己的 PM/工程/设计/数据,负责"People You May Know"等功能。CEO 级别的支持 + 清晰的使命 + 有效的成功指标。
Dropbox:混合模式,中央团队定实验流程,贡献者嵌入不同领域(引导、移动端、共享文件夹)。著名的推荐闭环(邀请好友送空间)就是从这个架构中诞生的。
Airbnb:嵌入式,增长 PM 嵌入房东入住、房客预订等不同产品团队。执行更贴近产品体验,但学习沉淀需要额外努力。
Pinterest:从集中式进化为混合式。早期集中力量解决漏斗问题,成熟后分散到国际增长、创作者增长等垂直方向。
3.3 五种关键角色
| 角色 | 职责 | 为什么重要 |
|---|---|---|
| Growth PM | 策略制定、实验协调、跨漏斗优化 | 需要"判断力",不是初级 PM 能做的 |
| Growth Engineer | 实验代码实现、数据追踪、增长闭环 | 全栈能力,理解"为什么"而不只是"做什么" |
| Growth Designer | 转化流程设计、行为心理学、快速测试 | 专注转化而非品牌美学 |
| Data Analyst | 洞察输出、仪表盘、实验验证 | 没有这个角色,团队在盲目飞行 |
| Growth Marketing | 获客渠道、落地页、消息实验 | 连接外部获客和产品内体验 |
来源:Growth Team Structure (Product School) | PLG Playbook for B2B Startups (Stage2 Capital)
Takeaway:团队结构没有标准答案,但有一个原则——增长团队必须有自己的指标所有权和实验自主权,否则就会被"业务-as-usual"吞没。
四、关键指标体系
4.1 AARRR 漏斗框架(Pirate Metrics)
AARRR 是增长领域最经典的指标框架,把用户旅程拆成五个阶段:
| 阶段 | 核心问题 | 关键指标示例 | 典型优化手段 |
|---|---|---|---|
| Acquisition(获客) | 用户从哪里来? | 流量来源、渠道 ROI、安装量 | SEO 优化、渠道投放 |
| Activation(激活) | 用户感受到价值了吗? | "aha moment" 转化率、激活率 | 引导流程优化、减少步骤 |
| Retention(留存) | 用户回来了吗? | D7/D30 留存、周活跃率 | 通知策略、核心功能打磨 |
| Referral(推荐) | 用户推荐了吗? | NPS、邀请发送量、病毒系数 | 推荐奖励、分享体验 |
| Revenue(收入) | 用户付费了吗? | ARPU、LTV、付费转化率 | 定价实验、付费墙优化 |
4.2 实验项目级别指标(六类)
评估整个实验体系的健康度,不能只看单个实验的胜率。需要六个维度的指标:
| 维度 | 含义 | 示例指标 |
|---|---|---|
| Volume(量级) | 跑了多少实验 | 季度实验数、参与人数 |
| Outcome(结果) | 实验效果如何 | 胜率、平均提升幅度 |
| Quality(质量) | 实验设计好不好 | SRM 检测通过率、数据完整性 |
| Engagement(参与) | 团队参与度 | 非增长团队的实验采用率 |
| Efficiency(效率) | 实验速度 | 从想法到上线的平均周期 |
| Alignment(对齐) | 和战略的一致性 | 实验与公司目标关联度 |
来源:AARRR Framework (Amplitude) | AARRR Pirate Funnel (PostHog) | Experimentation Program Metrics | Experimentation Metrics (Springer)
Takeaway:AARRR 是入门框架,帮你找到漏斗的薄弱环节。但要评估整个增长体系的健康度,需要看量级、质量、效率、对齐等多维指标。
五、常见误区与避坑指南
| # | 误区 | 为什么是坑 | 正确做法 |
|---|---|---|---|
| 1 | 没有 PMF 就开始做增长 | 在加速卖一个用户不想要的产品 | 先找到产品市场契合,再优化增长 |
| 2 | 把增长等同于 A/B 测试 | 增长是数据基础设施 + 用户体验 + 快速实验的组合 | 建立完整的实验体系,不只是改按钮颜色 |
| 3 | 只优化小流量功能 | 影响了 0.01% 用户 +50% 不如影响 50% 用户 +5% | 算绝对影响值,优先大流量入口 |
| 4 | PM 独占实验想法 | 工程师最接近代码和用户行为,有独特的洞察 | 工程师应该充当 mini-PM,贡献想法 |
| 5 | 偷看实验结果 | 会导致错误的决策和虚假的胜利感 | 遵守实验纪律:固定时长、holdout 组、独立评审 |
| 6 | 只看聚合数据 | 移动端和桌面端的表现可能完全相反 | 分维度切割分析(设备、渠道、用户类型) |
第 3 条展开说明:
Andrew Chen 举过一个经典的例子:很多团队会为影响了 0.01% 用户的功能改进 50% 而欢呼,却觉得影响 50% 活跃用户的功能改进 5% 不够看。但算一下绝对值,后者的影响力是前者的 250 倍。
来源:The Alexey Test | Andrew Chen 增长团队 PPT (36kr) | Growth Experimentation Guide (Ikaros) | 增长黑客 (百度百科) | 用户增长质量保证方法论 (京东云)
Takeaway:增长最常见的死法不是"不做实验",而是"做错了实验"或者"错误地理解了实验结果"。
六、总结
核心公式:
增长 = 数据驱动 × 快速实验 × 系统化流程 × 跨领域协作
回到开篇的四个层面:
| 层面 | 核心要记住的事 |
|---|---|
| 是什么 | 增长工程师 = 创业心态 + 实验思维 + 数据敏感 + 跨域能力 |
| 怎么做 | 实验基础设施 → ICE 排序 → Feature Flags → North Star → 增长闭环 → 7 步实验流程 |
| 怎么组织 | 独立/嵌入/混合三种模型,根据公司阶段选择;五种角色缺一不可 |
| 避什么坑 | 没有PMF别做增长、别只看聚合数据、别偷看实验结果、算绝对影响值 |
总结逻辑链:
增长工程师的本质是以工程手段驱动业务增长 → 先评估环境是否成熟(The Alexey Test)→ 用 ICE 框架排优先级 → 用 Feature Flags 做快速实验 → 用 North Star 对齐方向 → 构建增长闭环而非线性漏斗 → 遵守 7 步实验流程 → 避开六大常见误区
参考资源:
- How to think like a growth engineer (PostHog Newsletter)
- What is a growth engineer? (PostHog Blog)
- The Alexey Test: 11 steps to better Growth Engineering
- Growth Team Structure (Product School)
- AARRR Framework (Amplitude)
- 7-Step Experimentation Framework (Amplitude)
- Ultimate Growth Experimentation Framework
- Growth Experiments Framework
- A Complete Guide to Growth Experimentation (Ikaros)
- Growth Engineering: 6 Must-Have Mindset Traits (LinkedIn)
- North Star Metric (Product School)
- How to Win With OKRs and North Star
- PLG Playbook for B2B Startups (Stage2 Capital)
- Building a PLG Team (ProductLed)
- Feature Flags for Experimentation (ConfigCat)
- Feature Flags accelerate A/B Testing (Unleash)
- GrowthBook A/B Testing for Engineers
- Experimentation Program Metrics
- Andrew Chen: 打造增长团队 (36kr)
- Growth: 全栈增长工程师指南 (phodal)