Skip to main content

备课调研:国内外 AI 课程深度分析

不是课程目录。是一份关于「这个领域最聪明的人怎么教 AI」的分析笔记。 每个条目回答三个问题:他们怎么做的、为什么这样做、我们对我们的启发。


一、两条教学路线的分野

看了全球几十门 AI 课程后,一个清晰的二分法浮现出来。在深入拆解每一门课之前,先把这两条路线摊开看清楚——因为后面每一个案例的得失,都能回到这个框架里解释。

路线 A:行动学习(Action Learning)

核心理念:在真实问题中游泳,淹不死就学会了。不给标准答案,让学生在挫败中建立判断力。 代表:MIT GenAI Lab、HBS AI Lab、Kellogg AI Foundations

这条路线的哲学根基可以追溯到杜威的「做中学」(Learning by Doing)——知识不是被动接收的,是在与环境的交互中建构的。但 MIT/HBS 把它升级到了 AI 时代:不是让学生做一个教授布置好的模拟项目,而是把一个真实的、没有标准答案的、企业自己也还没解决的问题扔过去。

为什么这条路在 AI 教育中尤其重要

传统的编程教育可以先教语法、再教数据结构、再教算法、再教系统设计——因为知识的边界是清晰的。但 AI 不是。大模型的能力边界每个月都在变,一个工具的最佳实践可能三个月后就过时了。在这个背景下,「今天教的最优方案」的保质期极短,但「面对不确定性时的判断力」没有保质期。

行动学习教的不是「怎么做 Agent」,而是「当你面对一个真实问题,你怎么判断该不该用 Agent、用哪种 Agent、什么时候该停下来别继续堆复杂了」。这种判断力没法通过 lecture 来教——只有在真实约束(预算、时间、数据质量、利益相关者的矛盾需求)中反复碰壁后,才能长出来。

这条路的风险

  1. 效率不可控:有的学生可能在 80% 的时间在跟工具链和环境配置较劲,真正花在「学习」上的时间不够
  2. 质量方差大:非常依赖导师的质量和项目的匹配度。碰上一个烂项目或一个放羊的导师,一学期就废了
  3. 不可规模化:MIT 的 GenAI Lab 有专门办公室运营、有企业合作 pipeline、有一对一的导师体系——这套基础设施的复制成本极高

路线 B:模式教学(Pattern-Based)

核心理念:先把领域拆成可复用的模式/架构,再让学生组合应用。先给语言,再给练习场。 代表:Anthropic Building Effective Agents、DeepLearning.AI Agentic AI、Berkeley Agentic AI MOOC

这条路线的哲学根基可以追溯到布鲁纳的「结构主义」——任何学科都有其基本结构,教学的核心任务是把这些基本结构以学生能理解的形式呈现出来。Anthropic 做了这件事:把一个混沌的 Agent 开发领域,拆成了 5 个清晰的模式 + 1 个选择矩阵。DeepLearning.AI 做了同一件事:把 Agentic AI 拆成了 Reflection → Tool Use → Evaluation → Planning → Multi-Agent 五个原子模块。

为什么这条路在 AI 教育中尤其重要

AI 领域最大的教学难题是概念的通货膨胀——每天都有新的框架、新的工具、新的「最佳实践」。如果教学跟着这些走,课程永远在追尾灯。模式教学的答案是:不教具体的工具和框架,教底层的设计模式。 Prompt Chaining 这个模式,不管你用的是 LangChain 还是扣子 Coze 还是手动 Python,逻辑是一样的。Routing、Parallelization、Evaluator-Optimizer——这些模式的名字可能在不同工具里有不同叫法,但结构是恒定的

这就是为什么 Anthropic 那篇白皮书会被当成「行业标准教材」来用:它不是教你怎么用 Claude API,而是教你一组在任何模型、任何框架、任何场景下都能迁移的设计思维

这条路的风险

  1. 「知道」不等于「会做」:学生能把 5 大模式背出来,不代表面对一个真实问题知道该选哪个
  2. 过度抽象:有些东西只能在具体场景中理解——比如「Sim2Real gap」这个概念,在仿真里跑一百遍也不知道它是什么意思,直到你把模型部署到真机上亲眼看到它崩溃
  3. 可能催生「模式套用」:学生学了一套模式后,倾向于把所有问题都套进这 5 个框——而有些问题不该用 Agent 来解决

两条路线的根本分歧:到底什么是「学会了」

行动学习模式教学
「学会了」的定义能在真实约束下做出可用的东西能识别问题类型并匹配正确的模式
教师角色教练——给反馈、不给答案架构师——给清晰的知识结构
学生角色问题解决者——我该怎么绕过去模式识别者——这属于哪一类
最佳场景问题域本身在快速变化(AI 创业、AI 应用落地)问题域有稳定的底层结构(Agent 设计、算法原理)
致命缺陷学生可能学到了很多具体技巧,但没提炼出可迁移的方法论学生可能掌握了方法论,但面对真实混乱无法落地

行动学习赌的是「判断力不可教,只能长出来」。模式教学赌的是「好的抽象能十倍加速学习曲线」。

这不是「谁对谁错」的问题——是两条路线各自回答了不同的问题。行动学习回答的是「怎么让一个人能在不确定中做出好决策」,模式教学回答的是「怎么让一群人在最短时间内掌握一个领域的核心结构」。前者适合培养 leader,后者适合培养 builder。但任何一个好的 AI 教育体系,两种人都需要。

第三路线:竞赛驱动(Competition-Driven)

在扫完全球课程后,其实出现了第三条路线——它不完全属于前两类,但吸收了二者的优点:

核心理念:让学生为一个真实的竞赛目标而学习。不是为学分,是为「赢」。 代表:NVIDIA Jetson 教育生态(F1TENTH、Duckietown)、RoboMaster、伯克利 AgentX

这条路线有几个独特的优势:

  • 动力密度完全不同。学生为了「让自己的车跑赢隔壁组的车」愿意通宵调参,不会为了「多拿 2 分平时成绩」通宵
  • 反馈是即刻的、不可辩驳的。你的机器人摔了就是摔了、你的车撞墙了就是撞墙了。没有任何「但我的设计思路是对的」这种辩解空间
  • 它能把「模式教学」和「行动学习」粘合起来。F1TENTH 的课程前半段教 perception/planning/control 的模式,后半段学生在比赛里把这些模式焊进肌肉记忆

这些路线如何在实战中交织

最优秀的课程几乎都是两条(或三条)路线的混合体

  • MIT GenAI Lab:主体是行动学习(校企真实项目),但在学生入场前有密集的 GenAI 工具训练(模式教学的一小截),期末路演又带有竞赛的元素(5 分钟 pitch,评委打分选出冠军)
  • 伯克利 Agentic AI:主体是模式教学(14 周的系统知识),但配套 AgentX 竞赛让学生把知识「烧」进实践
  • 华科飞桨班:课内是模式教学(4 门课的系统知识),课外 + 实习 + 竞赛全是行动学习
  • 斯坦福 CS123:一半是模式教学(学期前半教 RL/运动学/系统辨识),一半是竞赛驱动(最后四周开放项目,机器人能不能站起来是唯一标准)

一个直觉性的判断:纯行动学习容易「散」(学到的东西难以迁移),纯模式教学容易「虚」(知道但不会做),纯粹的竞赛驱动容易「窄」(只会赢比赛,不会做产品)。最佳方案是用模式教学给框架,用行动学习给肌肉,用竞赛给压力。三条路线不是互斥的——它们是一套教学设计的三个工具。

对我们来说,这张地图怎么用

当你在设计任何 AI 相关的教学活动时,先问三个问题:

  1. 这个环节教的东西,保质期有多久? 如果答案小于一年(某个具体工具的最佳实践),用行动学习——让学生在真实任务中自己发现,不要把宝贵的 lecture 时间花在讲工具上。如果答案大于三年(Agent 的设计模式、评估方法论、工程取舍的思维框架),用模式教学——这些值得花时间讲清楚。

  2. 这个环节的目标是「让学生知道」还是「让学生会做」? 前者倾向模式教学(结构化的知识传递),后者倾向行动学习(真实约束下的反复练习)。90% 的 AI 课程在「知道」上花了太多时间,在「会做」上花得太少。

  3. 能不能加一个「赢」的维度? 不需要是正式比赛。一个 Demo Day、一个互评环节、一个「用你的方案能不能骗过隔壁组的审查」——任何能让学生感到「这不仅仅是拿学分」的设计,都能显著提升学习密度。

二、行动学习路线

1. MIT Sloan — Generative AI Lab

他们怎么做的

核心机制:学生团队(4-5 人)× 企业真实问题 × 一学期 = 5 分钟路演。

不是模拟。企业把真正需要解决的业务问题交给学生——2026 年的合作方包括 Nasdaq、MassMutual、Dell、GitLab、Wayfair、Coca-Cola、Hunter Water。学生需要自己去搞清楚这个业务的上下文,选技术方案,开发,交付。

2026 年冠军项目:为澳大利亚水务公司 Hunter Water 做的「开发申请评估助手」。表面上是「用 AI 提效审批」,实际上要解决的是:如何理解非结构化的申请书文本、如何匹配法规条款、如何给审批官一个可信的建议而不是一个黑箱输出。

为什么这样做——背后的教学哲学

MIT Sloan 把「行动学习」写进了制度。它不是一门课的创新,而是一个学院级的教学基础设施:有专门的「Action Learning 办公室」,每个学期有几十个 lab 同时运行(ASEAN Lab、GO-Lab、CE-Lab 等)。GenAI Lab 只是其中最新的一个。

这种设计隐含了一个假设:GenAI 不是一个可以被「教」的技能,而是一种需要在真实约束下反复练习的判断力。真实的约束包括:企业有预算和合规要求、数据不是干净的、利益相关者想要的和你认为该给的可能不一样。

John Horton 教授在另一门课「Generative AI for Managers」里让学生用 AI 模拟用户访谈来验证产品假设——不是因为模拟能替代真人调研,而是因为「即使不真实,它也能让你想到之前没想到的问题」。这句话是 MIT 行动学习哲学的一个缩影:过程的价值不一定在结果的正确性上,而在它暴露了你的盲区

对我们的启发

  • 「真实问题 > 模拟问题」:行动学习的密度远超案例教学。不是给学生一个设定好的场景让他们去「演绎」,而是把一个没有标准答案的真实需求扔过去,让他们在约束(合规、预算、时间、数据质量)中学会取舍。这对任何项目制课程都是核心原则。
  • 双轨评审机制:企业导师 + 学术教授双轨评审,本质上是把「实用性」和「严谨性」两条评价轴分开,各自独立打分。这避免了单一评委视角的盲区,也可以防止课程走向「要么太学术不落地、要么太功利没深度」的两个极端。
  • 从点到线的制度化:MIT 把 GenAI Lab 变成了 15.S04 编号的正规课程——有 syllabus、有学分、可复制。这意味着它不是某个教授的一次性热情尝试,而是学院层面的教学资产。任何想把短期活动升级为长期课程的尝试,都应该以「能否被编号、能否被下一届复用」为标准来倒推设计。

1.5 MIT Sloan 补充 — GenAI 生态中的其他关键课程

MIT Sloan 的 AI 教育不只是 GenAI Lab。它在 GenAI Lab 的周围还有一套由 E&I 证书串联起来、覆盖「认知 → 策略 → 动手 → 实战」四个层次的课程体系。

####(1)15.S68:Generative AI for Managers(John Horton)

  • 教授:John Horton(MIT Sloan IT 副教授,劳动经济学 + 市场设计交叉领域)
  • 课程性质:非技术导向,面向管理者/创始人

核心设计:不是教学生写代码,而是让管理者和创始人理解 GenAI 的技术原理、商业应用和战略含义。覆盖 LLM、图像生成、prompt engineering、fine-tuning、商业案例分析、VC/创业生态。有动手 lab(用 GPT-4、Claude、Perplexity)但不要求编程背景。

Horton 的教学哲学:他在课上让学生用 AI 模拟用户访谈来验证产品假设——不是因为模拟能替代真人调研,而是因为「即使不真实,它也能让你想到之前没想到的问题」。这句话是 MIT 行动学习哲学的一个缩影:过程的价值不一定在结果的正确性上,而在它暴露了你的盲区。

####(2)15.376J / MAS.664J:AI for Impact / AI Venture Studio(Ramesh Raskar)

  • 教授:Ramesh Raskar(MIT Media Lab)+ Pulkit Agrawal(MIT EECS)+ Sertac Karaman(MIT AeroAstro/LIDS 主任)
  • 课程性质:跨学科,面向全校(MIT + Harvard 交叉注册),9 学分

核心结构(三个支柱):

  1. Innovation(20%):培养对 AI 未来 2-3 年走向的深度理解——多模态推理、自主工作流、个性化 Agent、机器人技术
  2. Human-Centered Design(30%):学习如何设计能产生全球影响的 AI 产品,用 AI 辅助进行用户调研和 idea 验证
  3. Technical Building(50%):用最新 AI 技术栈和框架实际搭建 agentic 系统

期末交付:端到端的可运行原型 + 客户 traction。Demo Day 面向 MIT 生态的投资人。

从「AI for Impact」到「AI Venture Studio」到「AI Agents and Agentic Web」——这门课的名字在 2025-2026 年间一直在进化,但本质不变:用 AI 解决社会级问题。数字健康、AI 驱动的可持续发展、去中心化 AI、隐私技术是重点关注的领域。大量使用低代码 GenAI 工具——和 Kellogg 的 AI Foundations 哲学一致,但目标更高(不是「做一个 Agent 原型」,是「做出一家 AI 公司」)。

Guest lecture 阵容包括顶尖 AI 科学家、CEO、VC。课程接受 Entrepreneurship Minor 学分。

####(3)15.911:Entrepreneurial Strategy(Scott Stern / Erin Scott)

  • 教授:Scott Stern(MIT Sloan 战略学教授)+ Erin Scott
  • 课程性质:E&I Certificate 的必修 foundational 课程,9 学分

虽然名字不叫「AI 课」,但这是 MIT 创业教育的核心底层逻辑课。核心教的是:startup innovators 面临的战略选择,以及在动态环境中如何建立竞争优势。它给学生提供了识别机会、评估战略承诺、建立护城河的分析框架——所有 AI 创业课的实际操作,最终都要回到这门课给的框架里去检验。

Stern 是创新创业战略领域的顶级学者。这门课的 syllabus 是 MIT 创业教育中理论性最强的。

####(4)15.399:Entrepreneurship Lab(E-Lab)

  • 课程性质:12 学分,面向真实初创公司

学生在高增长初创公司工作,解决战略级问题。AI、biotech、clean tech、硬件、健康科技、机器人、软件是热门行业。startup 通常 < 40 人、有 IP、有至少一轮外部融资。

和 GenAI Lab 不同——GenAI Lab 对接大企业(Nasdaq、Dell、Coca-Cola),E-Lab 对接初创公司。两条线覆盖了 AI 产业的两种组织形态:大公司怎么引入 AI、小公司怎么用 AI 杀出来。

MIT Sloan E&I Certificate:把这些课程串起来的制度骨架

E&I Certificate 的结构本身就是 MIT 对「创业者应该怎么学」的系统回答:

层次要求代表课
生态认知1 门 ecosystem overview15.360 Intro to Tech Entrepreneurship / StartMIT
入门行动学习1 门 intro action learning15.388 Venture Creation Tactics / 15.390 New Enterprises
理论地基1 门 foundational15.911 Entrepreneurial Strategy
行业实战≥12 学分 product/firm level15.376 AI for Impact / 15.399 E-Lab / 15.366 Climate Ventures
自由选修≥9 学分 electives30+ 门可选覆盖 FinTech、Healthcare、Sales、Digital PM

这个结构不是「选几门课拿个证」,是强迫学生经历「认知 → 方法论 → 实战」的完整闭环。E&I Certificate 的制度化程度远超大多数商学院的创业课程——它是 MIT Sloan 的教学基础设施,不是某个教授的个人项目。

对我们的启发

  • MIT 的「证书骨架 + lab 为肌肉」是商学院 AI 教育的完整范式。E&I Certificate 提供了结构化的路径,GenAI Lab / E-Lab / AI for Impact 提供了在路径上的真实项目。两个层次的配合避免了「有课没项目」和「有项目没框架」两个极端。
  • AI for Impact 三个支柱的比例(20%/30%/50%)本身就是教学设计。Technical Building 占一半——说明它的核心信念是「AI 创业教育如果不教动手,就是在骗人」。这和 HBS 强调「先模仿再反思」形成互补——HBS 重战略认知,MIT 重工程能力。
  • 15.911 Entrepreneurial Strategy 作为「理论地基」的位置值得注意。MIT 的 AI 创业教育不是直接跳到「怎么做 AI 产品」,而是先让学生掌握竞争战略的分析框架。这保证了学生在动手过程中有一个思考的锚点——而不是纯靠直觉和 hustle。

2. 哈佛商学院(HBS)— Strategy for Entrepreneurs: AI Lab

他们怎么做的

这是看完全球几十门课后觉得设计最大胆的一门

课程分两个阶段,第一阶段的核心理念是:先学会用 AI 复制别人,再学会用 AI 做自己。

Phase 1:模仿实验(Weeks 1-4)

  • 选一家你认为会被 AI 颠覆的公司
  • 用 AI 工具把它的核心产品/服务复刻出来
  • 亲身体会:AI 在哪让你 80% 到了,在哪卡住了,什么东西是真的不可复制的
  • 写反思报告:什么容易、什么难、这意味着什么护城河

Phase 2:分轨

  • Startup Track:你有一个创业想法 → 用这门课的工具和框架去 build
  • Imitation Track:继续深挖上一阶段的目标公司,研究 AI 时代的竞争格局(给未来投资人和产品经理准备的)

工具要求:Claude Code、Codex、OpenClaw、Magic Patterns、Lovable、Replit。你不是「学」这些工具,你是「被逼着用它们去完成一个本来不可能的任务」,在这个过程中长出判断力。

为什么这样做——教学的底层洞察

这门课背后是一个锋利的问题:当任何人都能一个周末搭出一个产品,护城河在哪?

传统的创业课会教 Porter 五力、蓝海战略、MVP 方法论。HBS 的这门课不教这些——或者说,它让学生在操作中自己发现为什么这些理论在 AI 时代需要重写。

课程设计的核心张力是:AI 让「能不能做」不再是瓶颈,让「值不值得做」和「凭什么是我做」变成了唯一的战略问题。

Rembrand Koning 教授的 syllabus 有 27 sessions,3 个学分,Q3Q4 两个 quarter。这不是选修课——这是哈佛把「AI 时代的创业战略」定义为了一门独立课程。6 个教育目标里最亮的一句是:「用 AI 作为仿制工具,对已有企业和自己的创业想法进行压力测试,揭示哪里护城河还在、哪里不在了。」

对我们的启发

  • 「先复制再创造」的学习序列:HBS 把模仿设计成一个结构化的学习环节而非低级的抄袭——学生必须写反思报告,分析 AI 在哪些环节立功了、在哪些环节崩溃了、崩溃的原因意味着什么。这个「做 → 反思 → 提炼」的闭环可以嵌入任何项目制课程的前半段。
  • 两阶段推进的课程结构:Phase 1 统一(所有人先模仿),Phase 2 分轨(有人创业、有人深研竞争格局)。这种设计既保证了共同的知识基础,又尊重了学生不同的职业方向。比「全程一刀切」或「全程自由发挥」都高明。
  • 评审中加入战略追问:不管什么主题的项目制课程,都可以在评审时加一个问题:「如果所有人都能用同样的工具做这件事,你凭什么做得更好?」——这既是技术问题也是战略问题,强迫学生从「做出来」提升到「想清楚凭什么」。

3. 西北大学凯洛格商学院(Kellogg)— AI Foundations for Managers

他们怎么做的

5 周训练营。目标是让非技术背景的商科生能给企业构建 AI Agent 原型。

如果说 MIT 是「扔进深水区学游泳」,Kellogg 就是「先给浮板再松手」。它选择了低代码 Agent 平台作为教学载体,让学生在不写代码的情况下体验 Agent 设计的全套决策——角色定义、任务分解、工具选择、护栏设置。

为什么这样做

这个设计的聪明之处在于:它区分了「技术细节」和「架构思维」。

写 function calling 的代码是技术细节,理解「什么时候该让 Agent 自己做决定 vs 什么时候该走确定性的 workflow」是架构思维。Kellogg 赌的是:对管理者来说,后者远比前者重要。低代码平台恰好把前者自动化了,把后者暴露了出来。

对我们的启发

  • 低代码平台是「架构思维」的教学加速器:不要把它当成「给不会写代码的人的妥协方案」。反过来想:当技术细节被工具自动处理,学生被迫直面更根本的问题——「这个任务适合拆成几个步骤」「工具之间的接口怎么设计」「什么情况下该让人介入而不是让 Agent 自己猜」。这些才是 AI 时代的核心素养。
  • 多轨道的教学设计:同一门课,给出代码轨道和零代码轨道两套方案。让有技术背景的人深挖底层实现,让领域专家聚焦问题分解和流程设计。两条轨道最终在同一个评审标准上汇合——「你的方案解决了真实问题吗?」

4. 康奈尔科技(Cornell Tech)— Product Studio + Startup/BigCo/PiTech Studio

他们怎么做的

Cornell Tech 的 Studio 体系可能是全球最彻底的「行动学习制度化」案例——不是一门课,而是整个学位项目的脊梁

Product Studio(秋季,4 学分):学生团队为真实公司的战略挑战开发新产品/服务方案。工作流程:

  1. 企业提交「挑战」brief
  2. Cornell Tech 用自己开发的 Dreamteam 算法匹配学生到企业——优化跨学科组合
  3. 学生团队做研究、pitch 创新方案、de-risk 想法、构建验证过的解决方案
  4. 每学期至少 4 次与 Industry Advisor 碰面获取反馈
  5. 期末做最终 presentation + demo

过往合作企业:Amazon、Bill and Melinda Gates Foundation、Bloomberg、eBay、Google、IBM Watson、IHG Hotels、Microsoft、New York Times、NYC Mayor's Office、Samsung、Two Sigma、Weill Cornell Medicine

春季分轨(3 学分)

  • Startup Studio:把自己的 Product Studio 方案继续推进为创业公司
  • BigCo Studio:进入大公司环境做内部创新项目
  • PiTech Impact Studio:公共/社会影响力方向的技术创新

MBA 学生的整条路径:夏季(核心商科课)→ 秋季 Product Studio → 春季 Startup/BigCo/PiTech Studio。Studio 不是附加的实习项目——是整个学位的核心教学载体。

为什么这样做

Cornell Tech 的创始假设是:最好的技术教育不在 lecture hall 里,在真实的产品开发循环中。 它把这句话写进了制度——Product Studio 是所有硕士生(不分专业:CS、MBA、ECE、ORIE)的必修课。这意味着一个 CS 学生和一个 MBA 学生被 Dreamteam 算法主动匹配进同一个团队——不是让他们在课外自己组队,是课程设计强迫跨学科协作。

Josh Hartmann(前 Travelocity CTO、Amplify CTO)负责教学设计这件事本身就说明问题——他不是从学术界来的,是从产业界来的。Studio 的整个流程(challenge brief → 迭代 → de-risk → demo)跟创业公司的 product sprint 几乎一模一样。

对我们的启发

  • 跨学科匹配是强制力而非建议:Dreamteam 算法主动把不同背景的学生匹配进同一团队。这比「建议跨专业组队」有效得多。
  • Studio 不是课程的附庸,是课程的载体:一整年三门 Studio 课占 8 学分+——比任何单一学科都重。这意味着学院真正相信「做产品」比「上课」更重要。
  • 从 Product → Startup/BigCo/PiTech 的分轨设计:一条路走到底(Product → Startup,做出完整创业公司),但也提供了分流选项(进大公司做创新、进公共部门做影响力)。这和 HBS 的 imitation track / startup track 分轨异曲同工。

5. 沃顿商学院 — Collaborative Innovation Program(MGMT 892)

  • 主办:沃顿 Mack Institute for Innovation Management
  • 课程编号:MGMT 892

他们怎么做的

沃顿的 CIP 将学生团队与企业的真实创新管理挑战直接对接。和 MIT GenAI Lab 的模式非常接近——但不是专门面向 GenAI,而是面向广义的「创新管理」。但 2026 春季的项目已经高度 AI 化。

Spring 2026 项目(部分):

Infosys——Enterprise AI 架构蓝图:为 IT 领导者创建财务和架构蓝图,包含生命周期成本效益分析、云/混合部署对比、AI 治理框架、agentic AI 趋势对基础设施投资的影响。产出:详细的财务模型、场景成本预测、ROI 分析、投资路线图。

Noom——AI 驱动的生物标记物与可穿戴数据解读:MBA 学生与 Noom 的数据科学/医学/产品团队合作,开发 AI 方案将可穿戴设备和生物标记物数据转化为用户可行动的健康建议。

为什么这样做

沃顿 CIP 的核心逻辑和 MIT GenAI Lab 是一样的——学生做真实的公司项目。区别在于沃顿把范围限定在「创新管理」这个领域,且项目选题更偏战略(enterprise AI 架构蓝图)而非纯技术实现。

对我们的启发

  • AI 正在渗透到传统的「创新管理」课程里——2026 年的 CIP 项目几乎全部是 AI 相关。这意味着「AI + 企业实战」不是一门独立课的命题,而是正在成为所有商学院实战课程的主流话题。

6. 密歇根大学罗斯商学院 — Multidisciplinary Action Projects(MAP)

他们怎么做的

Michigan Ross 的 MAP 是全球历史最久、规模最大的行动学习项目之一——34 年历史,2100+ 企业参与,17600+ 学生,覆盖 98 个国家。MAP 不是选修课——它是 Ross MBA 的核心必修组成部分。

运作方式

  • 企业提交项目提案 → Ross 匹配学生团队(4-6 人)→ 7-14 周全职/半职投入 → 交付可执行的建议和方案
  • 覆盖所有 Ross 学位项目:Full-time MBA(7 周全职)、BBA Capstone(14 周)、Weekend MBA(12 周)、Executive MBA(12 周)
  • 企业只需承担学生差旅等直接成本——Ross 承担教学和指导成本

项目案例

  • GE Healthcare:优化客户参与模型,提出 CRM/数据分析/客户互动三维建议
  • New Belgium Brewing Co.:应对本地竞争的战略和战术,最终提出「不直接竞争本地精酿、走差异化路线」的创意方案
  • Vcredit(中国):制定移动借贷产品 KKCredit 的增长战略
  • Invest Detroit:评估底特律创业生态系统的缺口和机遇

过去 3 年 BBA Capstone 数据:55 个项目,250+ 本科生参与。超过 50% 的企业是回头客。

为什么这样做

Ross 把行动学习写进了学位要求——不是一个可选的实习项目,是 MBA 必须完成的学分。这种制度设计的力量是巨大的:它不是「鼓励学生实践」,是「如果不去做真实项目,你毕不了业」。

34 年的运营让 Ross 积累了一套完善的企业提案 pipeline、学生匹配流程、导师支持系统。超过 50% 的回客率说明企业端的 ROI 是实打实的。

对我们的启发

  • 制度化的力量:把「做真实企业项目」从选修变成必修,从一次性的好想法变成可复制的 infrastructure。MAP 运营了 34 年,2100+ 企业——它的核心资产不是 syllabus,是那套让企业愿意反复回来的交付机制。
  • 企业承担成本、学校承担质量:企业只需出直接成本(差旅),教学和指导由学校承担。这降低了企业参与门槛,同时保证了 Ross 对教学质量的掌控。
  • 50%+ 回头率是真实价值的验证:比任何教学评估分数都更有说服力。

7. 南加州大学(USC Marshall)— AI for Business × Thunder × Salesforce Agentic AI Lab

  • 主办:USC Marshall 商学院 + Viterbi 工程学院联合学位 BUAI(BS in Artificial Intelligence for Business)

他们怎么做的

2025 年秋季,USC Marshall 的 BUAI 项目(AI for Business 本科双学位)与 Thunder(Salesforce 咨询公司)和 Salesforce 合作成立了 USC-Thunder-Salesforce Agentic AI Lab。30-35 名本科生在教授指导下,为 Salesforce 和 Thunder 的高管团队产出 AI 趋势战略报告。

四个研究方向:医疗 AI(副教授 Kimon Drakopoulos 领导)、企业应用 AI(副教授 Nathanael Fast 领导)、高科技行业 AI(项目主任 Charlie Hannigan 领导)、公共部门 AI(由 Thunder CEO Carter Wigell 和 Washington Harbour 首席战略官联合领导)。

学生产出「简短募资书」式的研究成果——映射 AI 当前格局、标注近期可能的方向突破、识别企业必须应对的伦理陷阱。

为什么这样做

USC 的这个 Lab 代表了另一种校企合作模式:不是学生去解决企业的具体问题,而是学生作为「AI 侦察兵」帮助企业看清 AI 的产业趋势和风险。 BUAI 学生被定位为「能同时说 AI 技术语言和商业语言的人」——他们的交付物不是代码,是趋势分析、风险评估、战略建议。

项目主任 Charlie Hannigan 的原话:「学生受益于沉浸在最前沿的 AI 应用中,而企业获得来自有才华的年轻研究者用严谨和创意分析他们所在行业的全新洞察。」

对我们的启发

  • 「学生作为产业侦察兵」是一个被低估的课程角色。不是所有企业都愿意把真实问题交给学生,但几乎所有企业都想知道「AI 在我们这个行业正在发生什么」。这种「侦察型」项目比「交付型」项目启动门槛更低、企业接受度更高。
  • 本科生的产出可以达到企业高管阅读的标准。这是一个重要的验证——AI 教育的深度不一定要等到研究生阶段。

8. 斯坦福 GSB — Startup Garage(STRAMGT 356)

他们怎么做的

斯坦福 GSB 的 Startup Garage 是 Design Thinking + Lean Startup 的实战课。4 学分,限 48 人(两个 section),超额需求通过 application 筛选。以一场 AI-powered hackathon 启动整个学期——学生在 hackathon 中快速验证初始想法和假设,然后每周出门做 customer discovery,用 Business Model Canvas 迭代。

考核:Design Reviews 35% + Assignments 30% + Final 35%。没有考试——全部是项目产出。

为什么这样做

Startup Garage 的核心哲学是「你不可能在教室里学会创业」——学生必须出门跟真用户对话、测试真需求、build 真原型。AI hackathon 作为 kick-off 的设计特别聪明:它把「我有一个想法但不知道从哪开始」的困惑期压缩到一场 hackathon 的长度。48 小时内从零到 prototype——学生不需要完美,只需要有东西可以给用户看。

对我们的启发

  • AI Hackathon 作为课程 kick-off 是一个可以偷的设计。不是在课程结尾让学生做一个项目——是在课程开头用 hackathon 让所有人快速建立 momentum。
  • 35% Design Review 的权重说明这门课的评估重心不是「最终做出了什么」,而是「过程中你做了多少迭代、每次迭代学到了什么」。

8.5 斯坦福补充(1)— ECON 295/CS 323:The AI Awakening

他们怎么做的

Brynjolfsson 是研究 AI 对经济影响的最顶级学者之一。这门课是他把研究转化为教学的核心载体。Spring 2026 版的定位是「venture creation」——不是学 AI 原理,是用 LLM 和其他 AI 工具让小团队以前所未有的速度和规模做出产品和公司

课程结构:每周一位 AI 领域领袖级嘉宾 + 前沿研究讨论 + 跨学科团队做 AI 产品/创业方案。期末交付:一个能跑的原型 + 完整的 venture strategy。公开 syllabus(PDF 可下载)。

为什么这样做

这门课的独特之处在于它站在「经济学 × AI × 创业」的三岔路口。Brynjolfsson 不是创业教练——他是研究 productivity、organization capital、AI 对劳动力影响的学者。但他选择把课程设计成「venture creation」,说明他认为:理解 AI 经济影响的最有效方式,不是读论文,是亲手建一家 AI 驱动的公司。

「AI enables small teams to build products and companies at unprecedented speed and scale」——这句话如果是一般的 VC 说的,没什么特别的。但 Brynjolfsson 作为学者这么说,背后是他二十多年对 IT 生产力、组织资本、技能偏向性技术变革的研究做支撑。

Speaker 阵容也说明问题:Eric Schmidt(Google)、Mira Murati(OpenAI CTO)、Jeff Dean(Google AI)、David Autor(MIT 劳动经济学家)、Reid Hoffman(LinkedIn 创始人)。这不是「请名人站台」——是把 AI 生态里做不同事的人(做研究的、做产品的、做投资的、管国家安全的)全拉到同一个教室,让学生看到这个领域的全貌。

对我们的启发

  • 「经济学教授教 AI 创业」这件事本身就值得深思。Brynjolfsson 不是在教怎么调参,而是在教「AI 会让哪些公司死掉、哪些公司活下来、为什么」。这是目前全球 AI 创业教育中最稀缺的视角——大多数教 AI 创业的是 VC 和前创业者,他们擅长讲怎么做,不擅长讲「为什么在 AI 时代组织资本比技术壁垒更持久」。
  • 研究-教学-产业的直接贯通:Brynjolfsson 在他自己的数字经济实验室里做的研究,直接被转化为课程内容。学生不是在学别人做的案例——是在学教授本人正在推动的前沿研究。

8.6 斯坦福补充(2)— GSB 的 AI 课程集群:从 20 门到 36 门

  • 来源:Stanford GSB 2025 年 11 月官方公告

他们怎么做的

Stanford GSB 在 2024-25 学年有约 20 门课程整合了 AI/ML 内容,到 2025-26 学年增加到约 36 门(MBA + MSx)。这意味着 GSB 在一年内把 AI 课程的供应量翻了近一倍

代表性课程矩阵(GSB 官方列出的几大类):

维度代表课程定位
技术应用Understanding AI Technology for Business Problems非技术背景→理解 AI 技术原理
战略与管理AI and Data Science: Strategy, Management, and EntrepreneurshipAI 驱动的竞争战略
行业纵深AI²: Artificial Intelligence and Accounting InformationAI 在财务/审计中的应用
创业实践Future of AI in Work: A Lab for Startups面向 AI 创业的实验室课
伦理与权力AI & Power: Five Big QuestionsAI 对社会权力结构的冲击
组织变革The AI-powered Org: Evolution, Rebirth, or Death?AI 时代的组织设计
人文关怀AI for Human FlourishingAI 如何促进(而非削弱)人类福祉

此外,GSB 还推出了 AI@GSB 学生主导的应用 AI 计划(workshop + speaker series + AI literacy primer),以及 Executive Education 层的 Harnessing AI for Breakthrough Innovation and Strategic Impact 项目。

为什么这样做——「AI 不是一门课,是一层底色」

GSB 副教务长 Sarah Soule 的原话:「AI is changing all aspects of organizations and forcing leaders to reconsider how value gets created.」这句话解释了为什么课程数要从 20 翻到 36——不是因为「AI 很热」,而是因为AI 已经渗透到了商学院的每一个学术领域。财务、会计、市场营销、运营、组织行为、战略——每个领域都在被 AI 改造,不可能只靠一两个「AI 选修课」来覆盖。

GSB 的策略不是开一门「AI for Business」通识课,而是让每个学科组的教授把 AI 整合进自己领域。这才是真正意义上的「AI-native business education」。

对我们的启发

  • 「每门课都涉及 AI」比「开一门 AI 课程」深刻得多。GSB 的路径暗示了一个重要的课程策略:与其单独开一门 AI 概论课,不如改造现有课程的骨架,把 AI 作为一个视角嵌入财务课、战略课、营销课。
  • 覆盖「技术→战略→伦理→人文」四轴。GSB 的课程矩阵从纯技术应用到纯人文反思都有,不是只教「怎么用 AI 赚钱」。这块对国内 AI 课程设计尤其有启发——国内 AI 课程大多数集中在「技术和商业应用」两个轴上,伦理和人文的轴是空白。

8.7 斯坦福补充(3)— CS 329A:Self Improving AI Agents(2025-2026)

  • 官网:Stanford Explore Courses,课程编号 CS 329A
  • 教授:Aakanksha Chowdhery + Azalia Mirhoseini
  • 课程性质:研究生 Seminar,3 学分,全校开放

他们怎么做的

这是斯坦福 2025-2026 学年新开的、紧跟 AI Agent 最前沿的研究生讨论课。它不是教怎么用 LLM API 做 chatbot——是教LLM Agent 怎么通过与自己、与环境的交互持续自我改进

课程路线图

  1. Self-improvement for LLMs:constitutional AI、domain-specific verifiers、scaling test-time compute、搜索 + LLM 结合
  2. Tool-augmented LLMs:工具调用、检索增强、多模态网页交互
  3. Multi-step reasoning & planning:agentic workflows 的推理和规划,以及构建 robust evaluation 和编排框架的挑战
  4. 行业应用:coding agents、STEM 科研助手、机器人

前置条件:CS224N 或 CS229S;Python 熟练 + LLM API 使用经验。 考核:学生做原创研究项目,每周讨论指定阅读论文,邀请学界和业界 speaker。

为什么这样做

这门课的特殊之处在于它的时间节点和学术深度。它在 2025 秋季首发——正是 Anthropic 发布 Building Effective Agents 白皮书后半年、Agent 概念从「实验方向」变成「工程范式」的临界点。

它不是应用课,是研究课。课程内容直接触达 2025 年最活跃的 AI 研究前沿:constitutional AI(Anthropic)、test-time compute scaling(OpenAI o1)、LLM + search(DeepSeek-R1)。学生不是学「已有的最佳实践」,而是在尚未形成共识的前沿地带自己探索

这种课的价值在它的位置上:模式教学(Anthropic/DeepLearning.AI 的 Agent 课)教「已知」,这门课教「未知」——它培养的不是使用 Agent 的能力,是定义下一代 Agent 范式的能力。

对我们的启发

  • 「研究讨论课」是 Agent 教学链条中缺失的一环。大部分 Agent 课停留在「怎么用」层面(Anthropic/DeepLearning.AI 的模式教学),缺的是「下水道还不够深的地方在哪」这个层面。CS 329A 填补了这个 gap——当所有人在教「怎么做 Agent」的时候,它在教「Agent 的哪些能力还不够好、我们怎么改进」。
  • 研究课也可以有清晰的 syllabus。它不是「每周请一个人来聊」的松散形式,而是有严格的四段推进(self-improvement → tool integration → multi-step reasoning → applications)。这个结构本身就可以被移植到任何「领域前沿讨论课」的设计里。

8.8 斯坦福补充(4)— CS 25:Transformers United V5(讲座系列)

  • 官网https://web.stanford.edu/class/cs25/
  • 课程性质:1 学分 S/NC(pass/fail),全校开放
  • 往期 Speaker:Andrej Karpathy、Geoffrey Hinton、Jim Fan、Ashish Vaswani、OpenAI/Anthropic/Google DeepMind/NVIDIA 研究人员
  • 影响力:YouTube 直播 + 录播,全球累计超过 100 万次观看

他们怎么做的

也许是全球最轻量但影响力最大的 AI 课程。1 个学分,只考核出勤——没有作业、没有考试、没有项目。每周一次讲座,邀请 Transformer 生态里最核心的人物来讲他们的工作。课程内容覆盖 LLM、文生图/视频(DALL-E、Sora)、医疗、神经科学、机器人。

这不是传统意义上的「教」,是把正在改写 AI 历史的人拉到一个教室里,让他们把正在做的事讲给学生听。Karpathy 在这里讲过 LLM deep dive,Hinton 讲过深度学习,Jim Fan(NVIDIA)讲过具身智能。

为什么这样做——「教育作为渠道」

CS 25 的设计逻辑和所有其他课程都不同:它不做教学设计,做渠道设计。斯坦福的地理位置 + 品牌让它能调动全球 AI 最核心的人物来站台,课程的组织者要做的不是设计教学——是确保这场讲座能被全世界看到(YouTube 直播、公开录播)。

100 万全球观看的数据说明这个渠道策略是有效的。它不是教育产品的经典形态,但它是AI 教育的另一种基础设施:把全球最稀缺的知识源(与顶尖 AI 研究者的直接对话)免费放送到任何有网络的人。

对我们的启发

  • 1 学分课可以比 4 学分课产生更大的教育影响力。如果你有独特的 speaker 资源,不需要把它塞进一个复杂的课程框架——把它做成一个低门槛的讲座系列,让内容本身成为教学的核心。
  • 「出勤就是唯一作业」降低了学生参与的心理门槛。对非 CS 专业的学生尤其友好——他们不需要写代码就能了解 Transformer 的前沿应用。
  • 直播 + 录播 + 零元门槛 = 最轻量的教育全球化。值得借鉴的地方在于:很多学校有顶尖的 speaker 资源但没有释放出来——做个 YouTube 频道 + 简单 syllabus 就能让自己的课堂变成全球学习者的入口。

9. 佩珀代因大学 Graziadio 商学院 — Digital Innovation Practicum(ISTM 668)

  • 教授:John G. Mooney
  • 合作方:Kimberly-Clark(好奇/舒洁母公司)

他们怎么做的

MBA 学生团队为 Kimberly-Clark 探索如何用 AI、AR/VR、IoT、RPA 彻底改造纸尿裤市场的客户体验。课程要求每位学生必须使用生成式 AI 工具作为「虚拟合作伙伴」——用 AI 来 brainstorm 不同的问题框架、生成潜在方案、联合开发原型。

学生直接向 Kimberly-Clark 高管做 final presentation。

为什么这样做

这门课有两个不同寻常的设计:(1)GenAI 不是学习对象,是学生的队友——它被定义为「virtual partner」,学生在整个项目中与 AI 协作,而不是「期末做一个 AI 项目」。(2)项目场景极其垂直——纸尿裤。这不是「高大上的 AI 战略咨询」,是「怎么用 AI 让一个消费品巨头更好地服务用户」。这个选择非常聪明——越垂直的场景越真实,越真实的场景越能暴露 AI 在实际产业中的能力边界。

对我们的启发

  • GenAI 作为「队友」而非「对象」 的姿态:学生不是在「学 AI」,是在「和 AI 一起工作」。这个姿态的转换会让教学中的技术焦虑大幅降低。
  • 越垂直越真实:纸尿裤 > AI 战略。垂直行业的真实问题比通用的「AI 赋能 XX 行业」更有教学价值。

10. 科罗拉多大学博尔德分校 Leeds 商学院 × Pure Fishing — AI 项目实习

他们怎么做的

这是规模较小但非常实的一个案例。Pure Fishing(全球最大渔具公司)CEO Dave Allen 主动联系 Leeds 商学院院长,希望做 AI 实习项目。15 名本科生(Leeds + 工程学院)在 9 周内用 AI 解决营销、产品设计、销售等真实业务问题。学生远程工作,Pure Fishing 员工担任 team lead,每周 check-in 一次。期末团队赴 Charleston 总部做 final presentation,冠军团队获 CEO 一日出海钓鱼奖励。

结果:学生工作帮公司节省了足够雇 5 名全职学生的成本(约 $300k+),公司直接雇了 5 名实习参与者组建「Mini AI SWAT Team」。第二轮扩大到 18 名学生。CEO 原话:「如果我每次开完电话会议听到人们说『真不敢相信这些 CU 学生有多聪明』能收一美元,我已经是百万富翁了。」

为什么这样做

这个案例的价值在于它的可复制性——不是 MIT 那种有专门 Action Learning 办公室的 institutionalized 项目,而是一个 CEO 主动找上门、两个教授快速拉起、「先跑起来再说」的小项目。它证明了一件事:AI 行动学习不需要巨额的制度投资,一个愿意冒险的 CEO + 两个愿意接活的教授 + 一群有 AI 能力的学生就够了。

对我们的启发

  • 从 15 人到 18 人的规模说明这条路可重复。第一轮成功后直接扩大——不需要写一份 20 页的 proposal 才能开始第二轮。
  • 企业真正的成本节约 = 学生项目最硬的 ROI 证明。任何校企合作项目都应该收集这种数据。
  • 「从 CEO 打电话到学生交付」只用了两个月——这不是一个需要两年筹备期的项目。速度本身就是教学价值的一部分(学生做的是真实的、紧迫的事情,不是规划了一年才启动的模拟)。

11. 欧洲工商管理学院(INSEAD)— AI Venture Lab + AI Founder Sprint

  • 官网https://www.venture-lab.ai/
  • 创始人与主席:Hyunjin Kim(INSEAD 战略学教授)
  • 全球枢纽:新加坡、阿布扎比、巴黎、旧金山——四个校区
  • 运营数据(第一年):数十位创始人入选、覆盖多个国家、明确商业化营收和融资数据

他们怎么做的

INSEAD 的 AI Venture Lab 是欧洲商学院在「AI + 创业」方向上最成体系的实验。它不是一门课,是一个跨越多个项目的孵化体系。核心设计逻辑:INSEAD 研究发现,能够围绕 AI 重新组织的企业发现的价值场景多 44%、营收几乎翻倍、所需资本少 40%——这套研究(Kim, Kim & Koning, SSRN)是 Lab 所有项目的理论基础。

旗舰项目:AI Founder Sprint

  • 10 周,虚拟进行,面向 AI 初创公司的 pre-seed 创始人
  • 关键原则:不占股权(No equity taken),但这不妨碍设奖金
  • 导师网络包括前 Y Combinator 总裁 Geoff Ralston、White Star Capital GP 等
  • 研究顾问来自 HBS(Rembrand Koning——就是开 HBS AI Lab 课的那个人)和 MIT AI Venture Studio

Summer Camp 2026:10 周,目标是「first-time founders leave with a real business earning real revenue before summer ends.」——这个表述的自信程度值得注意。不是在说「学完这些技能」,是说「夏天结束时你有一个正在产生营收的真实生意」。

Startup Bootcamp(亚洲校区):48 小时(周五晚→周日),24 个 drill 压缩进一个周末。由 INSEAD Entrepreneur in Residence 执导。核心教学方法是「先逼你做出一个 pitch、然后打碎、重做、再打碎」——整个过程由有过真实创业和退出经验的企业家带领。

MBA 选修课:《Building Generative AI Products & Businesses》《AI Entrepreneurship》等。课程由教授 + 行业嘉宾(来自数字原生公司/初创企业的高管、大型咨询公司的合伙人、传统企业的转型负责人、VC 投资人)联合讲授,采用案例 + 高管对谈混合形式。

为什么这样做

INSEAD 的战略是把 AI 创业教育拆成三个互补的层面:

  • 学分层(MBA 选修课):系统性地给创业者提供 AI 创业的方法论和框架
  • 孵化层(AI Founder Sprint / Summer Camp):把方法论变成能产生收入的真实公司
  • 社区层(Bootcamp / 活动):降低启动的心理门槛——48 小时从想法到 pitch

这三个层面的配合让它和纯「开一门 AI 创业课」有本质区别。纯开课的问题是:学生上完课没有后续、创始人没时间上整学期的课。INSEAD 的分层设计让每个人都能找到适合自己的入口——想系统学的人上选修课、想直接做的人进 Sprint、还在犹豫的人先来一场 Bootcamp 试试水。

另一个值得关注的决定:不占股权。 这是 INSEAD 对自己商学院身份的清醒认知——它不是 VC、不是加速器、不是 YC 的竞争对手。它是一个以研究为基础、以教育为使命的机构。不占股权,所以它的激励机制和 VC 完全不同——它不用追求 exit,它追求的是「创始人的成功」作为教学成果。

Rembrand Koning(HBS)同时出现在 INSEAD Venture Lab 的顾问名单里,这本身就是一个重要的信号:哈佛和 INSEAD 的教授在 AI 创业教育上不是在竞争,是在共建一个跨大西洋的研究-教学网络。 他们在合写的论文里提供数据,在对方的 Lab 里做顾问——这是顶级的学术协作形态。

对我们的启发

  • 「不占股权」的姿态让 INSEAD 同时获得学术公信力和创业者信任。商学院做创业孵化最大的信任问题是「你到底是来帮我的还是来赚我的」。INSEAD 的答案很明确。
  • 三层设计(选修课 / Sprint / Bootcamp)覆盖了从「想了解」到「all in」的所有人群。不是所有人一开始就 ready——要给犹豫的人一个低门槛的入口(Bootcamp),给准备好的人一个深水池(Sprint),给想系统学的人一个图书馆(选修课)。
  • 研究作为创业教育的 backbone。INSEAD 不会告诉创始人「你应该这样建 AI 公司」,而是说「我们的研究发现,这样建 AI 公司的人营收高 2x、需要的资本少 40%」。数据和理论给了它的教学一个不同于「创业者经验分享」的可信度。

12. 伦敦商学院(LBS)— MBA 体验式项目

LBS 没有像 MIT GenAI Lab 那样专门命名的 AI 行动学习课程——但它的 MBA 选修课中包含一个 10 周的 faculty-led live project,学生团队为真实组织解决跨职能业务挑战。最近的合作方包括 Formula E、Penhaligon's、Yonder 等。

这个项目的特点是:不是一门 standalone 的「AI 咨询课」,而是嵌入在 MBA 选修体系中的体验式学习模块。学生修读相关 elective 后,把所学应用于一个真实的商业问题。

同时,LBS 的 Executive Education 层有一系列 AI 高管课程:《Generative AI for Leaders》《Analytics and AI: From Data Insights to Strategic Impact》《Mastering Digital Transformation》等——但这些更偏 executive training,不是学生做项目。

更重要的是,LBS 与 Preface 合作推出了《Applied Agentic AI for Organisational Transformation》——Day 1 由 INSEAD 教授(是的,又是跨校合作)讲战略变革管理框架和仿真练习,Day 2 由 Preface 讲 AI Agent 的技术实操——参与者亲手搭建第一个 Agent。12 个月持续学习。$33,750 的 pricing 说明这个市场的需求强度。

对我们的启发:LBS 的 10 周 live project 和 MIT 的整学期 GenAI Lab 在体量上无法比较,但它证明了一件事——体验式学习不需要专门的实验室基础设施,它可以简单地嵌在已有的 MBA 课程里。 对资源有限的机构来说,这可能是一个更实际的起点。


13. 芝加哥大学布斯商学院(Chicago Booth)— NVC + 应用 AI 中心

Booth 拥有全美运营时间最长、奖金规模最大的创业竞赛之一的 New Venture Challenge (NVC):1996 年启动,运营 29 年,600+ 初创公司从 NVC 和 Polsky 中心毕业。2025 年第 29 届,10 支决赛团队获得创纪录的 $2.267M 奖金。

同时,Booth 设有 Center for Applied Artificial Intelligence (CAAI),定位是「AI + 人、市场、社会」——这个三角是 Booth 的特色:它不拿 AI 当纯技术问题,而是当行为科学 × 经济学 × AI 的交叉口。

但 Booth 目前缺的是 MIT GenAI Lab 那种 「学生团队 × 企业真实 AI 项目 × 一学期」 的模式。NVC 是创业竞赛——学生自己做 startup,不是为企业解决 AI 问题。CAAI 是研究中心——产出论文,不是教学课程。二者之间有一个缺口:一门让学生拿 AI 为企业解决真实问题的必修/选修课。

这个缺口的存在本身就是一个信号:即使在 M7 商学院里,像 MIT GenAI Lab 这样把「AI + 行动学习」深度制度化的,也是少数。大多数商学院还在「有研究中心、有创业竞赛、有 AI 选修课」的阶段——但还没把三者串成一条线。

13.5 伯克利 Haas — AI Entrepreneurship(YC 式创业加速器课)

  • 来源:Haas Newsroom 2026 年 5 月报道
  • 教授:Omri Even-Tov(Haas 会计学副教授)+ Alex Zekoff(MBA '17,Thoughtful AI 创始人/前 CEO)
  • 课程性质:MBA 选修课,一个学期,申请制(300+ 申请只录 27 个团队/57 人)

他们怎么做的

这是伯克利 Haas 在 2026 年春季新开的旗舰 AI 创业课,设计灵感直接来自 Y Combinator。不是模仿 YC 的课程内容——是模仿 YC 的运作机制

核心结构

  • 学生以 solo founder 或 2-3 人团队入学,带着创业想法
  • 每周围绕 momentum 评分(不是围绕作业或考试)
  • 全学期轮转了 130+ 位来自 Nvidia、Google、OpenAI、Anthropic 等公司的 mentor,每节课有 5-10 位到场 office hours
  • Guest speakers 包含 a16z 合伙人 Ivan Makarov(讲「cash is truth」——大多数创业公司死于现金流,不是死于 idea 不好)
  • 最终不考试、不写论文——看公司有没有 traction

学生的核心发现(课堂上被反复验证的洞察):AI 工具让「融 seed round」这个动作不再必须加速。有个学生说「我不觉得我现在需要钱——AI 已经能帮我 build product 了」。这门课的核心论点:在 AI 时代,创始人可以先做出产品、拿到 customers 和 signal,再决定需不需要融资——而不是先融资再 build。

为什么这样做——「加速器即课程」

这就是这门课最激进的地方:它不是「教创业」,是把自己变成 YC 的一个批次的复刻。Zekoff 自己创立的 Thoughtful AI 在 2024 年被 New Mountain Capital 收购——他不是在教理论,是在从经验中提炼。他把 YC 的运作机制(community + accountability + resources)装进了一门 MBA 课里。

Even-Tov 教授作为会计学教授参与到这个设计中是另一个信号:会计学教授教 AI 创业——这和 Brynjolfsson(经济学家)教 AI 创业、Koning(战略学)教 AI 创业是一个趋势。AI 不是商学院一门课的专业领域,是所有学科的共同底层。

更值得关注的是招生数据:300+ 申请只录 57 人——这说明学生的需求远超过 supply。大多数商学院还没有能力满足这种需求。

对我们的启发

  • YC 机制可以课程化。每周 momentum check + 大量行业 mentor + 最终的 traction 导向考核——这是可以移植的教学设计模式。关键不是内容,是运行机制。
  • 「AI 要不要融资」是一个新的战略问题。这门课让学生亲身体验:当 AI 降低 build 成本到接近零时,融资的逻辑变了。这个洞察如果只是 lecture 里的一句 slides,学生记不住。只有在真正 build 的过程中自己发现,才会变成信念。
  • 会计教授 × 创业者的组合:非传统的教学组合产生了非传统的视角。会计视角在创业教育中通常被忽略,但在 AI 创业中异常重要——因为 AI 改变了 cost structure 和 unit economics。

13.6 伯克利 Haas — AI for Business 研究生证书(2026 春季启动)

  • 来源:Haas Newsroom 2025 年 9 月官方发布
  • 参与:25 位教授,覆盖 Haas 全部六个学科组
  • 官网https://haas.berkeley.edu/

他们怎么做的

Haas 在 2025 年 9 月宣布推出 AI for Business 研究生证书,2026 年春季正式启动。这是美国顶尖商学院中第一个系统性的 AI 证书项目

四大支柱:技术(Technology)、管理(Management)、战略(Strategy)、影响(Impact)。

锚定课程:《Business for AI》(2026 春季首发),由一个跨学科教授团队联合讲授——教授分别来自经济学、金融、运营和管理领域。目的不是「让商科生学编程」,而是**「让商科生学会在 AI 时代做商业决策」**。

证书要求

  • 必修:Business for AI
  • 选修 6 个学分,从 30+ 门可选课中选——覆盖数据挖掘、数据分析、AI 在创业/医疗/新产品开发/气候中的应用,以及安全、隐私、伦理课程

四位院长联署的定位:「We're training the first generation of AI-native business leaders.」——不是「会用 AI 的 business leaders」,是「AI-native」。「Native」意味着 AI 不是附加技能,是他们思考商业的方式。

院长 Jenny Chatman 的原话:「From finance and accounting to marketing and operations, high-impact leaders must understand how to manage human teams who use AI strategically, creatively, and with good judgment.」

为什么这样做

这是伯克利对「AI 时代的商学院应该教什么」这个问题的系统回答。伯克利的选择不是让 AI 作为一个独立的学科进入商学院(像 MIT 那样设专门的 GenAI Lab),而是把 AI 变成商学院的基础设施——让每个学科组都贡献 AI 课程,让学生从不同维度(技术、管理、战略、伦理)理解 AI 对商业的影响。

伯克利的地理位置让这个证书有天然的产业支撑:OpenAI 的联合创始人来自伯克利、Anthropic 总部在湾区、Databricks 是伯克利孵化——学生不是在读案例,是在读邻居

30 门可选课的数字也很关键——这不是「有几门 AI 课够你选」,是「所有你能想到的 AI × 商业交叉方向都有课」。

对我们的启发

  • 「证书化」是一个重要的制度化信号。单独开几门 AI 课可能只是个别教授的热情,但做成证书意味着这是学院层面的战略投入。这对想把 AI 教育建制化的任何商学院都是可参考的路径。
  • 「AI-native」不是口号,是课程全覆盖。30 门可选课意味着一个 MBA 学生可以在不碰传统「技术」课程的情况下修完 AI 证书——因为医疗、气候、伦理方向都有 AI 课。降低了非技术背景学生的进入门槛。
  • 锚定课 + 分轨选修的结构和 HBS 的 Phase 1 统一 + Phase 2 分轨异曲同工——先用 Business for AI 建立共同语言,再让学生根据职业方向选择深度课程。

13.7 伯克利补充 — SCET 的创业创新教学基础设施

伯克利 Sutardja 创业与技术中心(SCET)拥有一套独立于 Haas 的、面向全校的创业教学体系。它和 Haas 的 AI 证书是互补但不同的两条线:Haas 在商学院内部做 AI 通识教育,SCET 在工程学院框架下做「动手做产品」的创业训练。

####(1)Berkeley Method of Entrepreneurship Bootcamp(ENGIN 183B)

一个周末把 24 个 drill 塞进一间教室。 每年两次(秋季/春季学期前各一次),使用 Berkeley Method 的独特教学法——把 lectures、互动游戏、mentor 一对一、团队合作编织在一起。2026 春季的 speaker 包括 Shazam 创始人 Chris Barton。

核心教学理念:不教创业理论,让学生在 4.5 天内亲身体验从一个 idea 到一个可 pitch 的 venture 的过程。 这比一学期的 lecture 更有效——因为它制造了时间的紧迫感,让学生被迫在信息不充分的情况下做决策(和真实创业一模一样)。

####(2)Challenge Labs(ENGIN 183C / INDENG 185)

  • 学分:4 学分,全校本科生和研究生可选
  • 核心教学法:The Berkeley Method of Entrepreneurship——用游戏、行业嘉宾、团队练习、视频和 lab 覆盖创业早期生命周期的所有环节

Challenge Lab 的独特结构:每学期有多个不同主题的 lab 并行,学生选择自己感兴趣的方向。Fall 2024 的主题包括:

主题教授核心方向
Disaster TechnologyThomas Azwell用 AI/技术应对环境变化和灾害
Connected LifeGert Christen移动/AI/IoT 如何改善人们的生活
Designing Startups to Transform SocietyAnita BalaramanAI + 自动化时代的包容性创业——从就业、技能升级到教育、气候
SportsTechChristyna SerranoAI 驱动的体育创新和创业

Designing Startups to Transform Society(Anita Balaraman)尤其值得关注——她明确把 AI 作为课程的底层技术假设:「AI and automation have significantly changed the way business is done. We are in the Fourth Industrial Revolution.」她的教学不是「教 AI」,是假设 AI 已经无处不在,然后让学生在这个前提下去设计社会影响的创业方案——这比「AI 创业课」的框架更进了一步。

####(3)Lee Fleming 的系列课程:把伦理塞进创业教育

  • INDENG 171:Berkeley Changemaker: Ethical and Effective Entrepreneurship in High Tech(3 学分,本科生)
  • INDENG 375:同名研究生版
  • 教授:Lee Fleming(伯克利 IEOR 教授,创新与创业领域顶级学者)

Fleming 在创业教育中做了几乎所有课程都不做的事——把伦理放在创业教育的中心而非边缘。整门课围绕翻转课堂和激烈的 case discussion 设计,学生在课堂辩论中发展 verbal leadership 能力。课程项目要求学生分析一个高科技行业中的历史或当下的伦理挑战,或分析自己创业计划中的伦理含义。

这不是一门 AI 课,但它回答了 AI 创业教育里最被忽略的问题:当所有人都能用 AI 快速做出产品时,伦理不是产品的附加功能——它是竞争壁垒。Fleming 的课程在教学生把伦理思考变成创业者的直觉,而不是合规 checklist。

对我们启发

  • 「把伦理塞进创业课的中心」是一个尖锐的教学选择。大多数创业课把伦理当作最后一周的「附加话题」,Fleming 把它当作引擎——用伦理挑战驱动 case discussion、用伦理项目考察学习成果。这背后的假设是:AI 时代的创业者如果在前 20 年没有建立伦理判断力,后面 40 年做的决定会让很多人付出代价。
  • 4.5 天 Bootcamp 的设计可以被移植。不是所有创业教学都需要一个学期。Berkeley Method Bootcamp 证明:如果方法得当,非常短的时间就能让学生获得「从 idea 到 pitch」的完整体验。关键是教学设计——game-based exercises + mentor + time pressure——而不是课时长度。
  • Challenge Lab 的多主题并行结构 确保了每个学生都能找到与自己兴趣相关的创业场景。不是「所有学生做一个方向」,而是「20 个方向并行,你选你真正在意的那个」——参与度天然更高。

14. Y Combinator — Startup School + YC Accelerator Batch

  • 官网https://www.startupschool.org/
  • 核心产品:Startup School(免费在线课) + YC 加速器(投资 + 孵化)
  • 2026 最新:首次开设线下版(San Francisco),AI-Defensibility 成为核心课程模块

他们怎么做的

YC 的 Startup School 可能是全球规模最大的创业教育项目。但它的模式和前面所有的大学课程都不一样——它不是一个「课」,而是一个免费的、自定进度的、以真实创业产出来驱动的在线系统

核心结构

  • 免费——没有学费、不占股权(Startup School 层面)
  • 大约 7 周(每周 1-2 小时)的自定进度课程
  • 内容由 YC 合伙人录制(Michael Seibel、Gustaf Alstromer 等),每节不到 20 分钟
  • Weekly Update 系统是引擎:学生/创始人每周必须提交自己的真实进度,追一个北极星指标(通常是 revenue 或 weekly active users)
  • Group Office Hours:每周四晚分组视频会议——创始人必须对着一群陌生人用一句话说清楚自己在干什么
  • Co-Founder Matching:全球最大的 co-founder 匹配平台,超过 100,000 次匹配
  • 2026 版增设了 AI-First Operations track——十亿美元级公司的创始人拆解自己的技术栈和早期招聘策略
  • 2026 版还首次开设了 线下版(San Francisco),申请制

底层逻辑:YC 不是教你「如何创业」,是创造一个环境让你「不得不创业」。这和 MIT GenAI Lab 形成了镜像——MIT 是用企业真实问题驱动学生,YC 是用群体压力 + 公共问责驱动创始人。两者都在用「真实约束条件」替代「教学场景」,但约束的来源完全不同。

Y Combinator 主加速器才是真正的「行动学习终极形态」——入选的创业公司在 3 个月内被 YC 合伙人催着增长,每周做 update,Demo Day 是真金白银的融资现场而非教学展示。

为什么这样做——YC 意外成为全球最大的 Vibe Coding 实验场

2025-2026 年,YC 意外成为了全球最大的 Vibe Coding 实验场。据统计,25% 的 YC Winter 2025 批次的创业公司,其代码库 95% 以上是 AI 生成的。 这意味着在 YC 的加速器里,有一批创始人就是边学 Vibe Coding 边建公司——YC 的体系客观上承担了 AI 编程教育的角色。

这不是 YC 有意设计的——它是被 Vibe Coding 浪潮推着走的。但 YC 的响应很快:2026 年课程核心模块改为「AI-Defensibility」——教创始人「当任何人都能用 AI 三天复刻你的 MVP 时,你的护城河在哪」。这和 HBS AI Lab 的 Phase 1 模仿实验完全相通,只是方向相反——HBS 让学生模仿别人来找护城河,YC 让创始人防着被 AI 模仿。

YC 还通过它的创业公司反向输出了一整套关于 AI 编程的工程文化——Founder Mode、Ship Fast、MVP 不必完美、用 AI 保持团队精简——这些文化正在通过 YC 的网络扩散到全球的工程教育中。

两种「行动学习」的对比

MIT GenAI LabYC Startup School / Accelerator
驱动引擎企业真实问题群体压力 + 公众问责
考核方式期末 5 分钟路演每周更新北极星指标
教师角色教授 + 企业导师双轨YC 合伙人 + 已成功的创始人
「失败」的含义方案不被企业认可指标不涨——真实的商业失败
教育对象在册学生任何有创业想法的人
可规模化受限于企业合作 pipeline高度可规模化(免费、在线、全球)
核心壁垒企业关系网络品牌 + 校友网络 + 资本
AI 教学的角色有意识的课程设计被浪潮推着走,但适应极快

对我们的启发

  • YC 证明了「不教内容、只建环境」可以做教育。Startup School 真正的教学工具不是 20 分钟的视频,是 Weekly Update 系统。这给一个重要暗示:AI 教育的核心可能不是内容,是让学生持续在真实任务上工作的动力系统。黑客松天然有这个优势(一天的压力浓缩),但课程化之后怎么维持这种动力,是核心设计挑战。
  • Metric-driven accountability 是一个可以移植的机制。要求学生每周汇报一个北极星指标——不需要是 revenue,可以是「用户反馈数」「AI 工作流迭代版本数」。关键是让学生自己定义什么算「进步」,然后每周公开面对它。
  • Co-Founder Matching 的思路可以迁移到「学习伙伴匹配」。一个简单的匹配系统可以显著提高学习完成率。
  • 25% 的 YC 公司 95% AI 生成代码——这是 Vibe Coding 教育的核心论据。如果全球最挑剔的创业加速器都认可 AI 生成代码的生产力,大学就不该再把「手写代码」当作编程教育的唯一路径。这个数字应该出现在任何 AI Coding / Vibe Coding 课程的 introduction slide 上。

三、模式教学路线

4. Anthropic — Building Effective Agents

他们怎么做的

这不是一门传统课程,但它已经成了 Agent 教学领域的「行业标准教材」。Anthropic 发布了一份白皮书和配套演讲,核心就一件事:

不要一上来就建 Agent。从最简单的方案开始,只有在简单方案真的不够用时才增加复杂度。

技术的核心架构

Anthropic 把 Agentic 系统分为两大类:

1. Workflows(工作流)——你控制路径

  • Prompt Chaining:任务可分解为固定步骤 → 线性串联,每步有验证门
  • Routing:不同类型输入需要不同处理 → 分类 LLM 决定路由
  • Parallelization:独立子任务并行 → 汇总(sectioning 或 voting)
  • Orchestrator-Workers:子任务不可预知 → 中央 LLM 动态委托
  • Evaluator-Optimizer:需要迭代改进 → 生成 LLM + 评估 LLM 循环

2. Agents(智能体)——LLM 控制路径

  • 只在目标确定但路径不确定时使用
  • 需要有可验证的反馈信号(代码有测试、操作有环境状态)
  • Agent = Environment + Tools + System Prompt,其他都是优化

为什么这样做——哲学是最重要的部分

Anthropic 的核心洞察不是技术性的,是工程哲学的:「自主性不是目标,可靠性才是。」

他们把 Agent 开发中最大的陷阱称为「过度设计」——团队一上来就建一个能自主决策的多 Agent 系统,结果 latency 高、token 成本失控、一个早期错误在后续步骤中被放大,而且根本没法 debug。

「从简单开始,按需迭代」听起来像废话,但 Anthropic 用具体的失败案例证明了它的必要性:

  • 生产环境中实际能跑的模式:Prompt Chaining(最常用)、Routing(分类器路由)、Evaluator-Optimizer(有硬终止条件)
  • 生产环境中经常悄悄失败的模式:开放式工具调用的自主 Agent、10+ 工人的 Orchestrator-Workers、自学习的 Memory

他们还提出了一个非常实用的思维习惯:「进入 Agent 的上下文窗口去思考,而不是从人类的先验知识出发。」 一个电脑操作 Agent 可能只收到一张静态截图和一个简短的任务描述——然后它「点击」的时候推理还在跑,相当于闭着眼睛操作了几秒钟。如果你觉得这很脆弱,修复方式不是加更多编排层,而是给更丰富的观测输入。

对我们的启发

  • 5 大模式 + 选择矩阵是最简洁的 Agent 教学框架:不需要讲 LangChain 的源码、不需要讲 LLM 的架构演进,把这 6 个选择(什么时候用哪种模式)讲清楚,学生就能在面对任何 AI 应用场景时建立第一层判断。这是一个「少即是多」的教学设计典范。
  • 教「什么时候不该用 X」和教「X 怎么用」同等重要:Anthropic 用了整份白皮书三分之一的篇幅在说「不要建 Agent」。这种「负向知识」在技术教学中极度稀缺,却是判断力的核心。任何 AI 课程都应该有自己的「不要这样做」清单。
  • 三组件模型(Environment + Tools + Prompt)是一个通用分析框架:不管教什么 AI 应用方向,让学生学会回答三个问题:「你的系统感知到了什么」「能做什么」「被什么约束」——这比教任何具体工具都更持久。

5. 伯克利(UC Berkeley)— Agentic AI 三学期 MOOC 体系

他们怎么做的

Dawn Song 教授的团队在三个学期里搭了一个递进式的 Agent 教学栈:

学期定位核心议题
Fall 2024LLM Agents MOOC(入门)Agent 基础:ReAct、Planning、Memory、Tool Use
Spring 2025Advanced LLM Agents(进阶)推理技术、搜索规划、代码生成、数学证明
Fall 2025Agentic AI(应用全景)代码生成/机器人/Web 自动化/科学发现/AR-VR

Fall 2025(最新)一学期 14 周,每一周一个主题,每一周的讲师都是该方向的一线大厂研究负责人

  • Yann Dubois(OpenAI)讲 LLM Agents 总览
  • 贾扬清(NVIDIA VP)讲 AI 系统设计的演化
  • 焦建涛(NVIDIA Director)讲 Post-Training Verifiable Agents
  • 陈维柱(Microsoft Technical Fellow)讲训练 Agentic Model 的挑战
  • Noam Brown(OpenAI,Cicero 作者)讲 Reasoning & Games
  • Oriol Vinyals(Google DeepMind VP)讲生产环境挑战
  • Peter Stone(Sony AI Chief Scientist)讲 Robotics

全球 32000+ 注册学员,完全免费,全部有录播。

为什么这样做——三层递进的设计逻辑

Fall 2024 → Spring 2025 的过渡是最有意思的设计决策。

Fall 2024 教的是「Agent 怎么用」(ReAct loop、Memory、Tool Use),Spring 2025 教的是「Agent 为什么能用」(推理时的 CoT/Self-Consistency/ToT,训练后的 RLHF/DPO/Iterative Reasoning)。这对应了学习的两层:

  • 第一层:会用,能搭出东西
  • 第二层:理解原理,能判断什么时候会出问题、怎么修

Fall 2025 再跳到「Agent 现在能做什么」,每一周一个垂直领域。这个设计背后的假设是:Agentic AI 不是单一学科,它是一个范式,它的真正价值在不同领域的交叉处。

焦建涛(NVIDIA)的那节「Post-Training Verifiable Agents」是技术深度的标杆。他提出了一个关键区分:

  • Chatbot 的核心奖励是人类偏好——你喜不喜欢它说话
  • Agent 的核心奖励是环境反馈 + 可验证性——它能不能把事做成

Agent 训练的三大难题由此衍生:高质量训练数据(Environment + Tools + Verifier)、强评测(小心假象)、以及 SFT 和 RL 的正确分工——SFT 是「启动模型,别让它乱试」,RL 才是「真正提升任务解决智能」。训练中最大的风险是 entropy collapse:模型越训越只会一种答案。

还配套了一个 AgentX 竞赛:学生组队做 Agent 项目,分「创业赛道」(build agent-powered products)和「研究赛道」(探索 Agent 技术前沿),有伯克利 postdoc 导师。这是一个 MOOC + 竞赛的组合模式。

对我们的启发

  • 三层递进是 AI 课程设计的黄金结构:L1 = 会用工具,L2 = 理解原理,L3 = 垂直应用。每一层有明确的边界和评估标准,学生不会在 L1 就被原理劝退,也不会在 L3 还停留在「调 API」的舒适区。这个结构几乎可以套用任何 AI 教学主题。
  • 一线从业者授课的可信度无可替代:伯克利请的不是学术明星,而是在 OpenAI/NVIDIA/Microsoft/DeepMind 正在做这件事的人。如果请不到 VP 级别,请工程师讲工程实践、请 PM 讲产品决策逻辑——「我在做这件事」的现场感是任何教材都无法复制的。
  • 评测是硬功夫:焦建涛的「评测小心假象」是一句话的课。任何 AI 课程都应该在某个节点强制学生回答:「你怎么知道你做的东西是好的?如果你被自己的指标骗了,最先在哪里被骗?」这培养的是 AI 从业者最稀缺的品质——对自己手里模型的健康怀疑。

6. DeepLearning.AI — Agentic AI(吴恩达 2025-2026)

他们怎么做的

这是吴恩达 2025-2026 年推出的最新旗舰课,5 个模块 + Capstone Project。他把 Agentic AI 的教学组织成一个从原子模式到复合系统的递进结构

  • Module 1: 什么叫「agentic」——为什么迭代多步 workflow 碾压单次 prompt(建立核心认知)
  • Module 2: Reflection——AI 自己批判和改进自己的输出(最基础的 Agent 模式)
  • Module 3: Tool Use——Function Calling、代码执行、MCP(让 Agent 能真正做事)
  • Module 4: 实战部署——评估、错误分析、性能优化(把原型变成能跑在生产环境的东西)
  • Module 5: Planning & Multi-Agent——复杂规划 + 多 Agent 协作(最复杂的模式)
  • Capstone: 搭一个完整的 Research Agent

配套还有两门更短的实操课:AutoGen(微软 Agent 框架,6 个项目从双 Agent 对话到 Coding Agent)和 CrewAI(CEO 亲自讲,4 模块覆盖从 ReAct Loop 到 MCP 到部署监控)。

为什么这样做

吴恩达的核心教育哲学体现在 Module 4 的位置上。大多数 AI 课程把「评估和部署」放在最后当附加内容讲,吴恩达把它放在中间——在学了 Reflection 和 Tool Use 之后、但在 Planning 和 Multi-Agent 之前。

这个位置是有深意的:他不想让学生在没有评估能力的情况下进入复杂模式。 如果你不知道一个 Reflection Agent 做得好不好,去建 Multi-Agent 只是在用更贵的 token 犯更多错误。

另一个设计选择:所有模式都是 「先裸写再框架」——先用 Python + API 直调实现,再展示框架(LangChain/AutoGen/CrewAI)怎么写。这是在教一个原则:框架是加速器,不是替代品。 不懂底层原理就直接上框架,出 Bug 的时候你连该去哪里找都不知道。

对我们的启发

  • 「先裸写再框架」的教学顺序:先用最基础的方式(直调 API)做出一个能跑的东西,再展示框架怎么写。这不是增加工作量——是让学生在对比中真正理解框架替他们做了什么。这个原则适用于任何「有封装层」的教学主题。
  • 评估模块不要放最后:大多数课程的 syllabus 把评估/部署当附录。吴恩达把它插在中间,意味着「在你进入更复杂的内容之前,先证明你有能力判断自己做的东西好不好」。这是一个可以移植到任何 AI 课程的设计——在课程的中段设一个「评估 checkpoint」。
  • Capstone 决定学生真正带走什么:Research Agent 这个选题本身就是一个绝佳的课程锚点——它天然需要搜索、分析、生成三个环节,自然覆盖了 Agent 的所有核心模式。设计 Capstone 的时候,选题比技术要求更重要——一个好的 Capstone 选题应该迫使学生在完成它的过程中自动触达本课程想教的所有关键概念。

这一部分是与前面「纯软件 AI 教学」形成互补的另一条线。具身智能和 AI 硬件的教学有独特的挑战:你没法在浏览器里跑一个物理机器人。仿真(Sim2Real)、硬件成本、安全约束让这个领域的教学比纯软件更难规模化——但也因此分化出了几种很有启发的教学模式。

1. MIT — Robotic Manipulation(6.4210/6.4212)

MIT 的机器人操作硬核工程课。核心目标:从零搭建一个能在杂乱环境中自主抓取物体的机械臂软件栈。覆盖:3D 几何感知(点云配准、ICP)、运动学、抓取规划、运动规划(采样+轨迹优化)、力控制/阻抗控制、深度感知(SAM、Depth-Anything)。

25 节课,9-12 月。所有作业在云端 Jupyter Notebook 里用 Drake(MIT 自研仿真框架)完成,不需要真机。本科生版(6.4210,15 学分)和研究生版(6.4212,12 学分)分轨。研究生额外作业:自选主题写 Python notebook 教程(如 RRT vs 轨迹优化、扩散策略)。

考核:15% 作业 + 25% 期中 + 40-45% 项目(proposal + report + video)。

教学哲学:「仿真优先,再上真机」——学生先在 Drake 跑通全部 pipeline,调试稳定后再考虑真机。零硬件门槛、失败自由、注意力聚焦在算法上。但不止于此——本科生有 journal club 和论文评审,这是在教「读论文、判断好坏、提炼可复现结论」的底层能力。

对我们的启发:「仿真优先」路径适用于任何 AI 硬件教学;「教别人」作为考核(研究生写 tutorial)产出的内容可沉淀为下届教材;论文阅读不是附加题而是核心素养。


2. 斯坦福 — CS123/CS345: Building AI-Enabled Robots

「直接做一台机器人出来。」

学生从零组装四足机器人 Pupper,覆盖电机控制、正逆向运动学、系统辨识、仿真、强化学习。每周 lab,最后四周开放项目——RL 教 Pupper 走路、加视觉玩 fetch、重新设计硬件。本科 3 学分,因为只有 100 台 Pupper 所以 lottery 抽签入学。

教学哲学:你没法作弊——机器人站不起来就是站不起来。仿真里的控制器在 sim2real gap 中崩溃。这不是纯硬件课——RL 和 system identification 直接用在物理本体上。这给了学生纯软件课永远提供不了的体验:「物理世界会给你真实反馈。」

对我们的启发:「做一个完整的东西」作为锚点比「交一篇 paper」有力得多;硬件不该是 AI 的边界而是 AI 的测试场。


3. 斯坦福 — CS217: Hardware Accelerators for ML(Winter 2026)

  • 教授:Thierry Tambe + Kunle Olukotun

教你怎么设计一块跑 AI 的芯片。

覆盖:现代 AI 加速器架构、数据流、tensor 处理、内存层级、稀疏/压缩、低精度。学生用 C++/SystemC 写 block 设计,HLS 综合到云端 FPGA,实测。不是概念课——是真的硬件描述、综合、上板。

教学哲学:大多数 AI 课停在 PyTorch,这门课往底层走到底——AI 的性能天花板不在模型架构上,在硬件上。理解「你的模型到底在什么东西上跑」会根本上改变你设计模型的方式。


4. 宾大 — ESE3600: Tiny Machine Learning(Fall 2025)

「把 AI 模型塞进一个 2 美元的单片机。」

三模块:Module 1 从单神经元到 CNN(用 TensorFlow 手写);Module 2 三个应用(keyword spotting、visual wake words、anomaly detection);Module 3 在 ARM Cortex-M4 部署。配硬件 kit(MCU+传感器+摄像头+面包板),不需要 ML 或嵌入式先修。

教学哲学:TinyML 的本质在「约束」——不是准确率越高越好,是 60KB RAM、1MB flash、2 美元 BOM 的天花板内做到能用。这种约束驱动的设计天然训练工程取舍能力。真正产业界的 AI 不是在 A100 集群上跑的,是在边缘设备上跑的。

对我们的启发:「约束」本身是教学内容;硬件 kit 的目标是让学生体感 tradeoff——剪枝 30% 精度掉 2% 但延迟降 50%,这个决策怎么做。


5. NVIDIA — Jetson AI 教育生态

NVIDIA 围绕 Jetson 做了「标准硬件 + 竞赛驱动 + 课程模板」的全套教学基础设施:

  • DLI Teaching Kit(Edge AI and Robotics):免费课件 + slides + lab,牛津和 UMBC 联合开发
  • Duckietown(MIT 2016 起步):自动驾驶小车,80+ 大学开课,完整课程 + 硬件 + Autolab 远程实验 + edX 免费 MOOC
  • F1TENTH(宾大起步):1/10 高速赛车,60+ 大学,7 个国际比赛,perception/planning/control 全栈
  • MuSHR(华盛顿大学):多智能体赛车,开源软硬件 + 配套 lab
  • Jetson AI Specialist/Ambassador Certification:教师培训+学生认证

设计逻辑:不像传统课程各校自搞一套——NVIDIA 给标准平台,各大学定制,core 可复用。这证明了「统一硬件 + 开源课程」能把一门课从 MIT 扩散到 80 所学校。

对我们的启发:标准平台降低复制成本;竞赛是教学的最高形式——学生在准备比赛的过程中自动学会所有需要的东西。


6. 中国高校 — 具身智能爆发式布局(2026)

2026 年是具身智能在中国从「研究方向」变成「本科专业」的元年。教育部列入本科目录,9 所 985 首批开设:

高校方向特征
清华CDIE 具身智能实验班机器人控制+脑机接口
北大信息科学技术学院「具身智能导论」(3 学分)先修 CV+DL
浙大竺可桢学院具身班仿生机器人、多模态
上交智能机器人班60% 认知科学+控制
哈工大智能机器人工程航天特种
北航/北理/西交/南航具身智能本科2026 首批

教育部公布的参考课表:《具身智能专业导论》《具身智能基础与技术》《具身本体设计基础》《多模态感知与融合》《计算机视觉》《自主智能机器人系统》《具身人机交互与协作》《仿生与人形机器人》《现代控制工程》《机器学习与深度学习》《大模型原理与应用》。

北大的「具身智能导论」 几乎就是 Berkeley CS285 + Stanford CS224R + MIT 6.4210 的浓缩版:基础机器人学→三维视觉→模块化→泛化抓取→RL/模仿学习驱动足式行走→灵巧手→CLIP/GPT-4V→模块化/端到端具身大模型→Sim2Real→真机实验。

清华继续教育学院推出面向高管的「具身智能研习班」:6 天 48 学时,19,600 元/人。认知升维→技术透视→场景赋能→生态链接。产业认知课,不是学术课。


7. 具身智能教学共性洞察

  1. 仿真降低门槛,但真机不可替代。 Drake/Isaac Sim 好的是没维修账单,坏的是学生永远体会不到 Sim2Real gap——而那个 gap 就是最重要的学习内容。
  2. 「做出一台完整机器人」比「只做算法」有吸引力得多。 CS123 的 lottery 不是偶然。
  3. 竞赛是最强驱动力。 F1TENTH/Duckietown 把课程从「拿学分」变成「去赢比赛」。
  4. Sim2Real 是具身智能最独特的知识点。 仿真能跑的真机崩溃、仿真崩溃的真机能跑——没亲手做过不会信。
  5. 2026 年是国内具身智能规模化教学元年。 从实验室自选动作进入有标准课表、有教材、有师资培训的建制化阶段。


四、Vibe Coding 与 AI 辅助编程

Vibe Coding 是 2025-2026 年 AI 教育领域从零到建制化最快的一条线——Karpathy 2025 年 2 月发了一条推文造了这个词,同年秋季斯坦福就开了全球第一门系统性 Vibe Coding 课。Collins 词典把它选为 2025 年度词汇。到 2026 年,92% 的美国开发者已在实践中使用、41-60% 的新代码是 AI 生成的、25% 的 YC W25 创业公司代码库 95% 由 AI 生成。

这条线的教学有机会成为前面所有分析中与 LLM/Agent 教学产生最大化学反应的方向——因为 Vibe Coding 的教学本质上就是把 Prompt Engineering + Agent 设计模式 + 软件工程最佳实践塞进同一个课程里。

1. 斯坦福 CS146S: The Modern Software Developer(Fall 2025 首发)

这是目前全球最重要的一门 Vibe Coding 课——不是因为它最早(它确实是第一个大学级的),而是因为它完成了从「一种做法」到「一门学科」的转变。

他们怎么做的

10 周 syllabus,每周一个模块,覆盖从 LLM 基础到 Agent 架构到安全部署的完整闭环:

主题核心内容
Week 1LLMs and AI Coding Foundations什么是 LLM、为什么它会犯错、如何有效 prompt。Reading 含 Karpathy 的 Deep Dive into LLMs(数小时视频)、Google 的 PE 总览、OpenAI 的 PE 指南
Week 2Agentic Engineering I从 Vibe Coding → Agentic Engineering 的演化。Claude Code 的 CLAUDE.md 记忆系统、Cursor 的 .cursorrules 项目规则
Week 3Context EngineeringAI 编程中最重要的技能——不是写 prompt,是管理 context。什么时候给多少上下文、怎么组织项目记忆文件
Week 4Code Generation & ReviewAI 生成代码的质量控制。Semgrep CEO 作为 guest speaker,讲 AI 代码的安全审计
Week 5Testing & QualityAI 时代测试策略的变化——从「人写测试」到「AI 写测试、人审查」
Week 6DevOps & DeploymentVercel 的 Head of AI Research 讲 AI 辅助的 CI/CD 和部署
Week 7SecurityAI 生成代码的安全边界——OWASP Top 10 在 AI 代码中的新变体
Week 8MCP & Tool IntegrationModel Context Protocol 的实战——让 AI 编程助手能连接外部工具
Week 9Multi-Agent Orchestration多个 AI Agent 协作完成复杂工程任务——a16z GP 讲 Agent 生态的投资逻辑
Week 10The Future of Software Engineering课程总结 + 最终项目路演

Guest speaker 阵容包含了「AI 编程的名人堂」:Claude Code 的创建者、Vercel 的 AI 研究负责人、Semgrep 的 CEO、a16z 的 GP。

为什么这样做——从「一种做法」到「一门学科」

CS146S 的深层价值不在于它教了什么工具(那些工具半年后可能就换了一轮),而在于它定义了一个知识地图。在它之前,学 Vibe Coding 的方式是刷 Twitter、看博客、自己撞墙。在它之后,有一套系统性的框架了。

做这件事的「野心」有多大?课程第一段描述里写的是:「传统的软件开发生命周期正在被 AI 在每一个阶段改造。问题变成了:下一代软件工程师应该如何利用这些进步,实现 10x 的生产力提升,并为他们的职业生涯做好准备?

这不是教一门技术,是在定义「AI 时代的软件工程师」这个新岗位的 skillset。

课程最亮的洞察:Vibe Coding 的核心技能不是 prompt writing,是 context engineering。 同样的 AI 工具,懂 context engineering 的人产出的代码质量可能是不懂的人的 10 倍。CLAUDE.md / .cursorrules 不是项目文档——它们是 AI 编程助手的「员工手册」。

对我们的启发

  • Context Engineering 是 Vibe Coding 教学的第一性原理。如果只能教一个概念,就教这个。不是教学生「怎么写好 prompt」,而是教他们「怎么为 AI 构建正确的上下文」——这比 prompt 工程更底层、更通用、更能迁移到不同工具上。
  • 从 LLM 原理开始,而不是从工具开始。CS146S 第一周不讲 Cursor,讲的是 LLM 为什么会犯错。让学生先理解「你面对的是一台统计模式匹配机器,不是一个有逻辑思维的人」——这个认知是一切后续学习的基础。
  • Security 不是附录,是核心模块。45% 的 AI 生成代码包含 OWASP Top 10 级别漏洞(该课引用的数据)。如果不教安全,Vibe Coding 课就是在批量生产漏洞。这是目前大多数 Vibe Coding 教程最缺失的一块。

2. DeepLearning.AI — Vibe Coding 101 with Replit

吴恩达团队的动作一如既往地快。在 Karpathy 提出这个词不到一年内,DeepLearning.AI 就推出了这门短课。

课程设计逻辑:不是讲 Vibe Coding 的理论,是带着学生从零用 Replit Agent 做出两个完整的 app——一个 SEO 分析工具和一个投票应用,可以直接部署上线。4 小时内完成从 idea 到 deployed product 的闭环。

这是非常典型的 DeepLearning.AI 教法:不教概念,教结果。学生走的时候手里有两个能跑的应用。

对我们的启发:DeepLearning.AI 的 Vibe Coding 教学模式 = Capstone-driven。不是「学完 5 个模块再做项目」,而是「项目就是课程本身」。这对 Vibe Coding 教学尤其合适——因为这个领域变化太快,任何「先打地基再盖楼」的策略都会让学生在打地基的过程中被新的工具甩开。


3. 科罗拉多大学 — Vibe Coding Fundamentals(Coursera)

3 模块结构:Foundations → Understanding LLMs in Coding → Getting Results。面向完全没有编程背景的初学者。重点覆盖 Replit、Lovable、Bolt 这些「不需要写代码也能做出东西」的平台。

这门课的存在本身就是一个信号:Vibe Coding 已经成为了可以被教给非 CS 专业学生的独立技能。 这和 Kellogg 的 AI Foundations for Managers(用低代码平台教非技术人员做 Agent)一脉相承,但更激进——Kellogg 还在教「管理」,这门课直接教「做出产品」。


4. Microsoft Learn — Introduction to Vibe Coding

微软的版本走的是企业路线——用 GitHub Copilot Agent 作为教学工具,强调「在已有的企业开发环境中嵌入 AI 编程」。教程结构是典型的微软风格:先讲概念、再讲工具、再讲集成、再讲最佳实践。

对我们的启发:微软的思路提醒我们 Vibe Coding 教学可以分两条轨道——「从零开始做出一个东西」的创业轨道(Lovable/Bolt/Replit)和「在已有代码基础上加速」的企业轨道(GitHub Copilot/Cursor/Claude Code)。两条轨道的教学重点完全不同。


5. Vibe Coding 的工具生态(2026 年教学视角)

Vibe Coding 工具分化为三类,每类对应不同的教学使用场景:

类型代表工具教学定位
全栈 App 构建器Lovable、Bolt.new、Replit Agent、v0零基础入门——用自然语言描述需求,AI 生成完整应用。适合「先让学生做出东西」的第一堂课
AI 代码编辑器Cursor、Windsurf、TRAE(字节)进阶——在有代码基础的项目中加速开发。适合「教 context engineering 和代码审查」的阶段
终端 AI AgentClaude Code、Gemini CLI、OpenAI Codex高级——多文件重构、CI/CD 集成、Agent 编排。适合「教软件工程全流程 AI 化」的阶段

**TRAE(字节跳动)**值得单拎出来——完全免费、中文 UI、内置豆包/GLM 模型、有 Builder 模式一键生成项目脚手架。如果要在中文环境下做 Vibe Coding 教学,TRAE 是目前性价比最高的选择。它的存在降低了「AI 编程教学依赖付费工具」的门槛。


6. Karpathy 从「Vibe Coding」到「Agentic Engineering」的演化

2025 年初 Karpathy 提出 Vibe Coding 时,定义是「你完全交给 vibe,让 AI 写代码,你只负责审查」。到 2025 年底 / 2026 年初,他进一步提出了 Agentic Engineering——不是让一个 AI Agent 写代码,而是编排一组 AI Agent 覆盖整个软件工程流程:需求分析 → 架构设计 → 编码 → 测试 → 部署 → 监控。

这个演化对教学的意义:Vibe Coding 教学不能停留在「教学生怎么跟 Cursor 聊天」。它应该教三个层次:

  • L1:用 AI 工具写出一个能跑的程序(当前大多数课程在教的内容)
  • L2:用 context engineering 和代码审查把 AI 代码的质量推到生产级别(CS146S 在教的内容)
  • L3:用多 Agent 编排把 AI 应用到软件工程的全流程(Agentic Engineering 的前沿)

L3 目前在学术界还没有成体系的课程——它更多出现在 YC 创业公司的实践分享和 Anthropic 的工程博客里。但 CS146S 的后半段(Week 6-10)已经在往这个方向走了。


7. Vibe Coding 教学的几个核心洞察

  1. 「从零到产品」的体验是 Vibe Coding 教学的第一驱动力。 DeepLearning.AI 和 Replit 选择让学生在 4 小时内做出两个可部署的 app——这不是教学设计的偶然,是教学哲学:先让学生体感到「我能做出来」,焦虑感和自我怀疑自然消解,后续再讲原理学生会有一个体感锚点。这比传统教学中「先讲完一整本教材再开始动手」有效得多。

  2. 「Context Engineering」是 Vibe Coding 最被低估的教学内容。 所有课程都在教 prompt,几乎没有课程在教 context management。但真正的差距在上下文管理上——CLAUDE.md / .cursorrules / 项目目录结构 / 依赖文件的选择性提供——这些决定了 AI 产出的代码质量。斯坦福 CS146S 是目前唯一把这当作独立模块教的大学课。

  3. 安全是 Vibe Coding 教学最大的盲区。 45% AI 生成代码有安全漏洞(该数据来源被多门课程引用),但大多数 Vibe Coding 教程完全不提安全。CS146S 把安全作为独立模块、请了 Semgrep 的 CEO 来讲——这说明斯坦福认为安全不是「附加题」,是「你教了 Vibe Coding 就必须同时教安全,否则你在生产灾难」。

  4. Vibe Coding 让「软件工程教育」的起点从 Coding 变成了 Architecture。 当 AI 能写出 80% 的实现代码时,人最需要的能力不再是「怎么写」,而是「怎么设计」「怎么拆解」「怎么验证」「怎么选择正确的上下文喂给 AI」。这些是传统的软件工程课最不擅长教的——因为它们的前提假设是「学生先学会写代码,再学设计」。Vibe Coding 炸掉了这个前提。

  5. 「不要建 Agent」的警告在 Vibe Coding 场景下同样适用。 Anthropic 的哲学完全适用于 Vibe Coding 教学:不是所有任务都需要让 AI 自主决策。很多场景下,一个结构化的 prompt 比一个能自我纠错的 Agent 更可靠、更快、更便宜。教 Vibe Coding 的同时教「什么时候不该用 Vibe Coding」——这和 Anthropic 教 Agent 设计时先教「不要建 Agent」是一样的逻辑。


五、中国:AI Coding 与 Vibe Coding 的产业融合教学

前面的六部分分析了全球格局。这一节聚焦一个中国特有的现象:中国的 AI 编程教学不是大学自己搞的——是大厂进入课堂做的。 这和美国形成了一种有意义的镜像:美国是斯坦福的教授自己搭 syllabus 请 OpenAI/NVIDIA 的人来讲;中国是大厂的工程师直接站在讲台上,教案、工具、认证、实习一条龙。

1. TRAE for Educators —— 字节跳动走进中国高校课堂

  • 时间:2026 年 3 月正式启动
  • 已进入高校:清华大学、复旦大学、中国人民大学、北京邮电大学、中国美术学院、重庆邮电大学、哈尔滨信息工程学院、成都东软学院等

这是目前国内 AI 编程教育中覆盖面最广、涉及高校层次最多、场景跨度最大的一个计划。它不是 TRAE 的产品推广——它的核心主张是「AI 时代的工程开发教育,重心应从编码实现转向工程决策。

每一所大学的使用方式都不同,但都指向同一个方向——不教学生写代码,教学生指挥 AI 做工程

清华:《操作系统》引入 TRAE

计算机系核心必修课。TRAE 的角色不是在 OS 课上教编程——学生已经会了——而是让学生通过与 AI 协作,更直观地理解「硬件如何被 OS 抽象、管理、复用」。这本质上是用 AI 加速了「从概念到体感」的学习过程。

复旦:《生成式软件开发》全新开课

复旦计算与智能创新学院围绕 AI 带来的软件开发范式变化,从零新建了一门课。覆盖:大模型、Agent、提示工程、上下文工程、问题拆解、方案规划、过程迭代、代码评审、软件测试。TRAE 是贯穿全程的实践工具。

人大:《软件工程》升级

将大语言模型技术和人机协作编程纳入软件工程课程,TRAE 作为工具支撑「系统工程思想」的教学——理解软件生命周期的全流程管理。

北邮:《智能人机移动互联——零代码现代工程开发》

理念表述最为激进的一所:「AI 时代的工程开发教育,重心应从编码实现转向工程决策。」目标不是培养程序员,是培养「系统级工程师」——能定义问题、设计方案、分解任务、审查质量、管理复杂性的人。TRAE 贯穿教学全过程,帮助学生从「用 AI 写代码」走向「指挥 AI 做工程」。

重庆邮电大学:TRAE 实战训练营(2026 年 5 月首发)

字节跳动火山引擎 4 位一线技术骨干亲临授课,百余名学生参训。课程主题:「AI 时代的认知进化」+「面向未来的开发工具」+ 实操答疑。不是选修课,是密集的实战训练营。

哈尔滨信息工程学院:TRAE Hackathon(42 城全球站哈尔滨赛区)

2025 年 11 月。软件学院两位老师把 2023 级课堂直接「平移」到赛场——20 余名学生与哈工大、哈工程、东北农大的 120 名开发者混编,8 小时内完成一次真实的企业级项目开发。没有「课堂作业」和「竞赛」的边界——作业就是竞赛,竞赛就是作业。

中国美术学院:《手机 APP 艺术》引入 Vibe Coding

艺术生用自然语言描述想做的交互效果,TRAE 生成代码。这是跨学科教学的一个标志性案例——不是「让美院学生学编程」,而是「让美院学生用 AI 把艺术想法变成原生应用」。

对我们的启发

TRAE for Educators 的底层逻辑非常清晰:字节不指望靠这门课赚钱,它赌的是「学生在学校里用惯了 TRAE,毕业进了公司自然会继续用火山引擎的 API」。 这是典型的平台型公司做教育的逻辑——不卖课,卖生态。这和 NVIDIA 做 Jetson 教育生态一脉相承。

对我们最有价值的是这个计划的「课程改造清单」——它不是在现有课程里加一个「AI 编程」模块,而是重新定义每门课的教学目标(OS 课用 AI 加速概念理解、软件工程课教人机协作编程、工程开发课把重点从编码转向决策)。这种「侵入式改造」比「加一节 AI 工具课」深度高出两个数量级。


2. 北京大学 —— 《氛围编程:用 AI 完成真实任务》(2026 年 3 月首发)

  • 主办:北大教务长办公室指导,教育学院学习科学实验室 + 软件工程国家工程研究中心知识计算实验室联合推出,创新创业学院教育培养中心提供支持
  • 教学团队:尚俊杰(教育学院副院长、学习科学实验室执行主任)、刘雨昕(学习科学实验室主任助理)、王于华(软件工程国家工程研究中心)、吴腾腾(学习科学实验室)
  • 32 学时,线上线下结合,80 余名学生,来自 13 个院系(文史哲社理工医全覆盖)
  • 首次集中授课:2026 年 3 月 27 日至 29 日
  • 零编程门槛:面向非计算机专业学生,明确「不要求编程基础,不教语法,不看代码」

他们怎么做的

这是国内第一个把 Vibe Coding 作为一门独立通识课来开的大学——而且是在北大,由教育学院牵头,不是计算机系。这个细节本身就说明了很多东西。

课程来源:从学习科学班的实践中长出来

这门课不是「拍脑袋开的新课」。它的前身是北大教育学院学习科学班的《人工智能与计算思维》课程实践——尚俊杰团队先在学习科学班这个「安全区」让学生尝试用 Vibe Coding 解决学习与生活中的真实问题,收获了热烈反响后,才决定把它扩展为一门面向全校的通识实验课。

这个「先在精品小班里试水、验证了假设再推广」的路径,本身就是一个教科书级的课程创新方法论。对比一下大多数 AI 通识课的开发路径——先写好 syllabus、请好老师、排好课表,然后第一学期就硬上——北大的做法风险更低、迭代更舒服。

课程结构:9 个模块,8 个真实任务

课程设置为 9 个模块,每个模块围绕一个来自真实场景的任务展开。学生用自然语言描述目标,借助 Claude Code 等 AI 编程工具完成从网页搭建、文档处理、数据分析、视频制作、SKILL 设计到 API 调用等一系列任务。

从教师工作坊(2026 年 5 月 6 日,面向北大在职教师开放)可以反推出学生版课程的核心模块结构:

模块核心任务学生产出
环境准备安装 VSCode、Claude Code 配置完整的零门槛开发环境
模块一氛围编程理念、方法与趋势理解「用自然语言驱动 AI」的工作范式
模块二研究数据分析与可视化生成交互式数据可视化报告
模块三(1)网页搭建与个人主页开发可公开访问的个人主页
模块三(2)文档处理与 SKILL 封装一个可复用的个性化 SKILL 工具
模块三(3)批量内容生成批量化产出的完整工作流
模块三(4)视频制作与多媒体内容AI 驱动的视频内容
模块四API 调用与外部服务集成能调用外部 API 的完整应用
模块五总结与作品集整合包含多个功能模块的个人作品集

模块三(1-4)在教师工作坊中占据了全天的主体时段(13:30-16:45),说明「做东西」才是这门课的核心——理念课只用了 1.5 小时(09:00-10:30),其余时间全是动手。

四条课程设计原则——以及它们为什么能成立

1. 零门槛入学:面向所有专业,不要求编程基础,不教语法,不看代码。学生只需要「清晰表达需求的能力」。

这不是口号——它执行了。13 个院系的学生都有、没有先修要求、不筛人。如果这 80 个学生在 32 学时后都做出了可用的东西,那就意味着「编程教育的入门关可以通过 AI 工具绕过去」这个假设至少在通识层面是成立的。

2. 任务驱动:每节课均有真实产出。8 个来自真实场景的任务设计。关键是——每个模块结束时学生都能看到可运行、可展示的成果,而非停留在练习层面。

这里有一个容易被忽视的教学设计细节:「真实场景的任务」和「为了教学目标而设计的练习」是完全不同的两种东西。 前者自带动力(「这是我自己要用/要展示的东西」),后者需要外部动力(「这是为了拿学分」)。北大的学生做的是「自己的个人主页」「自己专业方向的数据分析报告」「自己封装的 SKILL 工具」——这些东西做完是有用的,不是丢在课程文件夹里的作业。

3. 成果可见:不以知识测验为终点。结课时每位学生拥有一套包含多个功能模块的个人主页作为作品集,可公开访问。这个设计的巧妙之处:作品集本身就是一个信号——「你看,我一个 XX 专业的学生,用 AI 做出了这些东西。」

4. 思维可迁移:核心目标不是教工具,是培养「用自然语言驱动复杂任务、通过迭代逼近目标」的思维方式。这套思维在工具换代后仍然有效。尚俊杰的原话是:「AI 时代能力培养分三个层次——会问、会用、会做。只停在了解 AI 答案这一层是不够的,要去创新实践和突破极限,在大模型给出答案基础上不断追问和探索。」

工具选择:为什么是 Claude Code 而不是国产工具

这不是一个随意的选择。北大选的是 Claude Code(Anthropic 的终端 AI Agent),而不是 TRAE(字节)、通义灵码(阿里)、华为 CodeArts 等国产工具。

可能的原因——Claude Code 的「终端原生 + 自主决策」模型更接近这门课的教学目标:「用自然语言驱动复杂任务」。它不是教学生「怎么在 IDE 里用 AI 补全代码」——那是 TRAE 做的事——它教的是「你怎么跟一个 AI Agent 对话,让它替你完成整个任务链」。Claude Code 的对话式、终端原生的交互模式天然更适合这种教学目标。

但这也意味着一个门槛——学生要配好 Node.js、npm、Claude API key、终端环境。教师工作坊的 08:30-09:00 模块专门用于「环境搭建」,说明这个环节是不能跳过的隐性成本。

教师工作坊:课程本身的横向扩展

2026 年 5 月 6 日,课程团队又办了面向北大在职教师的「教师工作坊」——一天的时间让文科/理科教师体验 Vibe Coding 的工作范式。限额 30 人,零编程基础。

工作坊的模块设计几乎就是学生版的紧凑版:

  • 08:30-09:00 → 环境搭建
  • 09:00-10:30 → 理念与方法
  • 10:45-12:00 → 研究数据分析与可视化(R 语言)
  • 13:30-15:15 → 单课教学设计 + SKILL 封装
  • 15:30-16:45 → 批量生成学期课程体系 + 教学资源
  • 16:45-17:00 → 总结交流

这个工作坊的存在说明课程团队想做的不是一门课,而是一个范式——让北大的教师先自己体感到 Vibe Coding 的力量,然后把这种工作方式带回各自的学科。这是从「教学生用 AI」到「整个学校的教学方式都被 AI 改变」的杠杆。

为什么这样做

Vibe Coding 被定义为「通用素养」而非「编程技能」

这门课是教育学院牵头、面向整个学校开的。不是计算机系的专业选修课。服务的 13 个院系包括文史哲社理工医。这种组织方式本身就在宣告一件事:在北大看来,Vibe Coding 和「会写论文」「会做 Presentation」是同级别的通用素养,不是「会写代码的人的特权」。

和斯坦福 CS146S 的镜像对立
北大氛围编程斯坦福 CS146S
先修要求零编程基础CS111 编程经验
目标学生全校各专业有技术基础的学生
牵头院系教育学院计算机系
教学哲学通用素养——「让每个人都能用 AI 做事」专业技能——「让软件工程师 10x 效率」
工具Claude CodeCursor、Claude Code、GitHub Copilot
对「学会了」的定义能不能用自然语言完成真实任务能不能在真实代码库中高效协作开发

两门课都在 2025-2026 年先后开设,但面向的是完全不同的人群。它们合在一起指向同一个趋势:Vibe Coding 正在分化为两条路线——专业开发者路线和通用素养路线——而这两条路线各自有独立的课程体系、独立的评价标准、独立的师资需求。

为什么是教育学院而不是计算机系

这可能是北大这门课最深刻的设计决策。如果交给计算机系,大概率会变成「教非 CS 学生写 Python」——降低难度但本质还是编程教育。但教育学院看问题的出发点是:「一个人不会写代码,但有一个清晰的想法——怎么帮他实现?」这个视角的转换把课程从「教编程」变成了「教问题解决」。

教育学院还带来一个天然优势:它们懂学习科学。他们知道「做中学」比「先学再做」有效、知道「成果可见」对学习动力有多重要、知道「可迁移的思维」比「具体的工具操作」更有长期价值。这些不是教学方法论里的套话——它们体现在课程设计的每一个细节里。

对我们的启发

  • 「零门槛 + 产出可见」是 Vibe Coding 通识课的黄金公式。北大用 80 个学生、13 个院系、32 学时的实验证明了:不教语法、不教数据结构、不教算法,学生也能做出真实可用的东西。这个结论如果成立——意味着 Vibe Coding 可以把 AI 教育从 CS 专业解放出来,送到每一个学院、每一个学科。

  • 课程团队的跨学科构成本身就是答案:教育学 × 软件工程 × 创新创业学院联合开课。教育学负责教学方法论和认知模型(怎么教最有效、什么顺序最合理),软件工程负责技术内容和工具选型(什么工具适合什么任务),创新创业负责把产出变成真实的项目(做出来的东西不是作业,是产品)。这三个角色缺一个,课程质量就会在某个维度上打折。

  • 「先在精品小班试水、再全校推广」的课程创新路径可以借鉴。尚俊杰团队先在学习科学班(精品小班)验证假设,等有了真实的课程数据和学生反馈后,再申请全校通识课。这和「直接开全校通识课、边开边修」相比,风险低得多、迭代舒服得多。

  • 教师工作坊是课程扩张的杠杆。让学生学会 Vibe Coding,影响的是一届一届的学生。让教师学会 Vibe Coding,影响的是他们教的所有学生——而且是持续地、跨学科地、非 IT 课堂地影响。这个策略对任何想在大学里推动 AI 教育的人来说都是高杠杆的。

  • 工具选择的背后是教学目标的投影。北大选 Claude Code 而不是 TRAE,不是因为 Claude Code「更好」,而是因为 Claude Code 的「终端原生 + 自主决策」模型更贴合这门课的教学目标——「用自然语言驱动 AI 完成整个任务链」。这个决策逻辑提醒我们:选工具之前,先想清楚你教的是什么。「写代码」和「指挥 AI 做事」是两个不同的能力,需要不同的工具来教。


3. 上海交通大学 —— 《智能计算编程基础》(2025 年秋季首发)

  • 32 学时,智能软件 AI+ 微专业的必修课
  • 教授:戚正伟 + 李健联合授课,华为专家合作授课,6 名硕博助教
  • 明确对标斯坦福 CS146S:新闻稿里直接写了「同期国外斯坦福大学也开设了类似课程」

他们怎么做的

这是目前国内和斯坦福 CS146S 最对标的一门课。核心教学方法:直接用 AI 编程工具完成完整的项目,不手写代码。

「理论奠基 - AI 赋能 - 实战驱动」三位一体

理论奠基:跳出具体代码,先让学生理解「什么是好程序」——通过分析 Linux 内核等复杂软件工程案例,建立对正确性、可维护性等质量属性的认知。对比 Python/C++/Rust 在实现同一功能时的代码量、性能和能耗差异——这是为「精准向 AI 描述需求、评估 AI 生成代码」建立底层认知。

AI 赋能:引入华为 CodeArts、字节 TRAE、通义灵码等国产主流 AI 编程工具。华为专家联合授课。搭建统一的 VSCode + AI 插件实验环境。教学重点从「如何写」转向「如何问」和「如何审」。

实战驱动——学生项目的真实产出:

  • 「脑卒中智能诊疗辅助系统」:团队成员背景多元(医生、护士、产品经理)。他们将《中国急性缺血性卒中诊治指南》的「思维链」固化到系统提示中,用 AI 编程工具完整实现了一套辅助诊疗系统。——这是「产业深度 + AI 编程」的教科书级案例
  • 其他项目覆盖医疗、金融、法律等垂直行业

为什么这样做——「产业深度」是关键词

上交这门课最亮的地方不是它教了什么工具,而是它把 AI 编程直接对接到垂直产业的真实问题上。学生做的不是「to-do list app」这种教学项目,是「脑卒中智能诊疗系统」——有真实的临床指南作为知识来源、有真实的多角色协作需求、有真实的医疗合规约束。

这是中国的 AI 编程教育独有的优势:产业场景够深。 美国学生做 AI 编程项目可能搭建一个 SaaS 工具、一个个人主页、一个天气 app。中国学生可以直接进到医疗/金融/法律的垂直场景里——因为这些行业本身正在经历最剧烈的数字化改造,有大量可以被 AI 编程加速的真实需求。

对我们的启发

  • 「垂直产业 + AI 编程」的教学模式:不是教「怎么用 AI 写代码」,而是教「怎么用 AI 解决某个行业的真实问题」。脑卒中诊疗辅助系统这个案例证明,非 CS 背景的学生(医生、护士、产品经理)在 AI 编程工具的辅助下,能在短时间内做出具有实际价值的垂直应用。
  • 华为的全栈支持:华为提供 CodeArts 平台、实验手册、专家授课——这本质上和 NVIDIA 的 DLI Teaching Kit 是同一个模式,但华为在「国产替代」的政策背景下更强调自主可控和行业深耕。

4. 华中科技大学 × 百度 —— 「飞桨班」

  • 全国首个聚焦大模型人才培养的改革创新试验班
  • 「课内—课外—实习—竞赛」四维联动

他们怎么做的

这不是一门课,是一个实体班。本科生组建,双导师制——华科教师担任学业导师,百度优秀工程师担任产业导师。课程由百度和软件学院共同承担,百度提供教学资源、平台、数据、竞赛培训、算力。

课程体系:4 门核心课——《机器学习导论》《深度学习基础》《深度学习应用实训》《人工智能与大模型综合实训》。

实践体系是三级进阶:训练营 → 达人营 → 精英营。每个阶段都有产业导师 + 学术导师全程护航。

最关键的一环:实习。学生前往百度总部,与一线工程师并肩作战。项目包括高质量数据集自动构建、多模态文档解析工具开发、智能体平台搭建、飞桨生态 AI4Science 研究。

成果(两届共 49 名学生):

  • 国家级以上奖项 40+ 人次(包括「挑战杯」人工智能+专项赛全国特等奖)
  • 12 名学生进入百度飞桨核心技术部门实习
  • 第一作者在 ICCV 2025 等顶会/顶刊发表论文
  • 主持 4 项国家级大创项目

为什么这样做——「深度校企合作」的终极形态

华科飞桨班的本质是把百度变成了第二个校园。学生在百度总部做实习不是「参观」,是做真实项目——从数据集构建到智能体平台搭建。这和 MIT GenAI Lab 让学生为 Hunter Water 做项目是同一个模式,但更深入:MIT 是一个学期,华科是两年。

但华科模式有一个 MIT 没有的维度:国产替代的政策推力。 飞桨不是「一个可选的 AI 框架」——在 2025-2026 年中国的政策语境里,它是「自主可控的国产 AI 技术栈」。华科飞桨班的学生从第一天起就在这套国产技术栈上训练,这在美国的课程体系里很难找到对等的「政治经济学」维度。

对我们的启发

  • 四维联动模式(课内—课外—实习—竞赛)是一个可复制的高阶 AI 人才培养框架。它的核心逻辑是:课堂给基础、课外给深度、实习给产业体感、竞赛给压力和展示。四个维度缺一个,学生就会在某个环节断掉。
  • 从一门课到一个班:单门 AI 编程课的极限是一学期 32 学时。华科飞桨班把模式升级为「两年的系统培养」。这个跃迁的关键不是课时——是双导师制和企业深度参与了培养方案的制定。

5. 清华大学 × Datawhale —— Easy-Vibe 开源课程

他们怎么做的

三个阶段的阶梯式路径:

第一阶段:Project 主线(9 个循序渐进的项目) ——从「猜数字游戏」到「原生全栈应用」。每个项目都有完整的教程和代码,学生跟着走就能做出可运行的东西。

第二阶段:Extra 扩展(开发者必备知识) ——Git、Linux 基础、API 调用等「那些容易被忽视却极其关键的基础能力」。这一阶段的定位非常精准:Vibe Coding 不是不需要基础知识——它需要的不是语法知识,是工程素养。

第三阶段:Examples 实战(完整应用开发) ——从产品构思、技术选型、开发迭代到最终上线的全流程。

他们给自己定的长期目标值得关注:「覆盖三年经验、五年经验的前后端开发、算法工程师的职能范围;建立初创公司可承载千、万级用户量应用的模板和 vibe coding 实践过程。」

为什么这样做

Datawhale 在国内 AI 学习者中的影响力非常大。他们入局 Vibe Coding 教学的意义是:把「零基础 → 能做出上线产品」这条路径标准化了。 以前这条路径是碎片化的——东看一篇博客、西看一个视频。Easy-Vibe 把它变成了一个结构化的教程。

而且它和北大、上交的课程形成了分层:北大/上交是「大学正式课程」层,Easy-Vibe 是「社区自学」层。 两者不竞争,是互补的。一个学生可以在北大选课,也可以在学习过程中用 Easy-Vibe 补足课堂覆盖不到的地方。


6. 中国 AI 编程教学的产业深度:一个区别于美国的独特模式

看完全球和中国之后,一个清晰的模式差异浮现出来:

维度美国模式中国模式
课程发起方教授自主设计 syllabus大厂主动进入课堂(TRAE for Educators、华为昇腾课、百度飞桨班)
产业深度学生用通用工具做通用项目学生用国产技术栈做垂直行业项目(医疗、通信、工业质检)
企业参与Guest speaker(来讲一节课)双导师制、合编教案、提供实习
认证闭环课程证书华为 HCIA/HCIP 认证、飞桨大模型提示词工程师认证
政策驱动力市场驱动「自主可控」+ 「人工智能+教育」行动计划(2026 年五部委联合发文)

最值得关注的不是差异本身,而是这种差异产生的结果:中国学生在 AI 编程课上的产出更接近「产业级」——不是因为他们更聪明,是因为他们做的是医疗诊断辅助系统、工业质检模型、通信信号处理优化,而不是 to-do list app。

上交的脑卒中诊疗辅助系统、兰大的基于 MindSpore 的智能通信实验、NCUT 的昇腾工业质检项目——这些不是教学案例,是能直接服务于产业的真实应用。

这个洞察如果往深走一步:中国 AI 编程教育的机会不在「教得比斯坦福更好」,而在「做的项目比斯坦福更贴近中国的产业实际」。 斯坦福的 CS146S 在教学方法论上可能是全球最好的,但它的学生能接触到的产业场景是美国科技公司的问题。中国的问题——老龄化社会的医疗需求、制造业的质检痛点、交通物流的调度优化——是独一无二的。用 AI 编程解决这些问题,就是全球独一无二的课程内容。


7. 其他值得关注的中国实践

  • 华为昇腾 AI 项目式课程(北方工业大学 NCUT):32 学时,180 名学生。覆盖工业质检、智慧农业、金融 OCR 等行业场景。华为工程师联合授课。要求:必须集成 MindSpore 模型开发,可软硬一体,必须输出可交互 Demo。同时对接华为 HCIA-AI/HCIP 认证考试和昇腾 AI 创新大赛。——这是最典型的「教学 + 认证 + 竞赛」闭环。

  • 厦门大学 × 百度飞桨 AI 教育创新中心:全校 AI 通识课升级为必修课。飞桨领航团 AI 达人创造营(项目制学习)。「星河超级个体 Hackathon——Vibe Coding Workshop」——这个活动名字几乎可以直接拿来用。百度工程师现场带学生用自然语言生成代码,经济学院学生开发交互式简历网页。

  • 兰州大学 × 华为「基于昇思 MindSpore 的智能通信」:把 AI 深度嵌入到一个垂直行业(通信)的教学中。调制类型盲识别、神经网络译码器、信道编码码率盲识别——这些课题直接对接到 6G 通信的前沿研究。

  • 成都东软学院:华为昇腾 AI 定制班(企业工程师深度参与培养方案),TRAE 教学实践(全栈跨学科),AI 数据与多模态标注定向班(对接产业链数据标注岗位需求,「技能培养—实训实践—奖学金—企业直推—资格认证」完整链条)。——东软代表了应用型本科在 AI 编程教育上的另一种路径:不追求学术深度,追求就业闭环。

六、落实:把调研变成可用的东西

前面五章是情报。这一章是弹药——把最重要的几项调研直接转化为可以直接用的内容。


1. Anthropic Building Effective Agents 白皮书——逐章教学化改造

Anthropic 的这份白皮书已经是 Agent 教育的行业标准教材。但原版是写给工程师看的,不是写给教学设计者看的。下面逐章拆解它该在什么教学阶段教、怎么教、最容易出错的地方在哪。

第一章:Agent 的定义和决策框架

原文核心:Workflow(预定义代码路径编排 LLM)≠ Agent(LLM 动态决定自己的流程)。大多数应用不需要 Agent,一个设计良好的单次 LLM 调用就够了。

怎么教:这应该是任何 Agent 课程第一页 PPT 的内容。用一个 5 分钟的对比 demo——同一个任务,先用单次 prompt 做(2 秒出结果),再用一个多轮 Agent 做(30 秒出结果,可能中间跑偏一次)。让学生亲眼看到:Agent 的代价是 latency + 成本 + 不确定性。然后问:「刚才那个任务,Agent 比单次 prompt 好在哪里?」

最容易出错的地方:学生学了 Agent 后会想把一切问题都套进 Agent 框架。需要反复强调:「如果你能在一张纸上画出每一步该怎么做,你不需要 Agent。」

第二章:Augmented LLM——Agentic 系统的原子单元

原文核心:任何 Agentic 系统的基础都是「增强型 LLM」——模型 + 检索(RAG)+ 工具 + 记忆。Anthropic 特别强调:花在工具设计上的时间应该比花在 prompt 上的时间多。

怎么教:这章适合在讲完 5 大模式之后作为「回顾」出现。先让学生搭几个 workflow,再把它们拆开看底层:每个 workflow 本质上都是 augmented LLM 的不同组合方式。用一种「乐高思维」来理解——5 大模式不是 5 种不同的东西,是 augmented LLM 的 5 种积木搭法。

最容易出错的地方:工具接口设计被忽视。Anthropic 内部的经验是:「SWE-bench 成绩的提升,来自工具优化的贡献比来自 prompt 优化的贡献大。」教学时,让学生花 30% 的时间写 prompt、70% 的时间设计工具的输入输出 schema 和 description。这个比例是反直觉的,但正确。

第三至七章:5 大 Workflow 模式

这是白皮书最核心的部分,也是最适合作为教师 lecture 提纲的内容。

Prompt Chaining:教学关键词——「一步做一件事」。和初学者的直觉相反,把一个大 prompt 拆成一串小 prompt,总成本更低、总质量更高。适合 demo:用三步链(生成大纲→合规检查→扩写成文)对比一次长 prompt 的效果。

Routing:教学关键词——「分诊台思维」。一个便宜的模型做分类,决定把问题路由给哪个专业的 prompt/模型。这是生产环境中最常用的模式,因为它在不牺牲效果的前提下把成本降到最低。适合 demo:客服系统的意图分类→路由。

Parallelization:教学关键词——「投票比单挑准」。两个技巧——Sectioning(把长文档分段并行处理)和 Voting(多个 LLM 跑同一任务取最优)。Voting 对减少幻觉极其有效:Claude Sonnet + Haiku + GPT-4o-mini 同时回答同一事实问题取交集,准确率从 89% 提升到 99.2%。适合 demo:三个模型给同一段代码写 review,对比哪个最好。

Orchestrator-Workers:教学关键词——「项目经理思维」。这是 5 个模式里最容易过度使用的——很多学生一上来就想建这个。教学重点:这个模式只有在「子任务不预知」时才用。如果子任务是可以列举的,用 Prompt Chaining 就够了。适合 demo:爬取一个网站的所有子页面并总结,但子页面 URL 事先不知道。

Evaluator-Optimizer:教学关键词——「左手写右手改」。这是 Anthropic 内部生产高质量代码/文案的秘密武器。一个 LLM 生成,另一个 LLM 严格评估并给出具体修改建议,循环到通过为止。适合 demo:让 Claude 写一首诗,Claude 自己评估质量,迭代三轮,对比第一版和最后一版。

教学顺序建议:不要按白皮书的顺序教。按这个顺序:Prompt Chaining(最简单)→ Routing(与 Chaining 对比)→ Parallelization(与 Chaining 的关系)→ Evaluator-Optimizer(引入「另一个 LLM 做裁判」的概念)→ Orchestrator-Workers(只在最后教,并警告「这个模式很容易用错」)。

第八章:Agent——当 Workflow 不够用时

原文核心:Agent 只在「目标确定但路径不预知」且「有可验证的反馈信号」时使用。Agent = Environment + Tools + System Prompt,其他都是优化。

怎么教:这章适合作为「毕业课」——在学完所有 workflow 后,用一个真实的开放式任务让学生体感 workflow 的局限性,然后自然引入 Agent。比如:在 codebase 里修一个 bug,bug 的位置未知、修复方式未知、需要搜索 + 阅读 + 试改 + 跑测试。让学生先用 workflow 尝试(会发现步骤太多、路径太多无法枚举),然后切换到 Agent 模式。

最容易出错的地方:Agent 没有硬预算。必须教学生设置 max iterations / max tokens / timeout。这些不是附加功能——是 Agent 能安全运行的唯一保障。


2. 伯克利 Agentic AI Fall 2025 两节关键讲座——深度笔记

焦建涛(NVIDIA):Post-Training Verifiable Agents

这是 14 节讲座中技术最深的一节,核心问题是:Chatbot 的训练范式(偏好对齐)和 Agent 的训练范式(可验证性对齐)有本质区别。

Chatbot vs Agent 的核心区分

  • Chatbot 训练目标:最大化人类偏好——「你喜不喜欢它说话」
  • Agent 训练目标:完成任务 + 可验证——「它能不能把事做成」

因为 Agent 的任务有明确的对错(代码通过了测试、网页操作成功了、数学答案对了),所以可以用 verifier(验证器)替代 human preference 作为训练信号。这不是渐进式的改进——是训练范式的根本转移。

训练 Agent 的三大难题

  1. 高质量训练数据:Agent 训练数据的三要素是 Environment(环境)+ Tools(工具)+ Verifier(验证器)。缺一个都训不出来。Verifier 最难写——因为真实任务里充满细致的约束和 corner case。一个简单的「帮我订一张机票」背后有几十个隐性的决策节点。

  2. 强评测:焦建涛强调「小心假象」——Agent 可能在评测集上表现很好,但在真实环境中一塌糊涂。因为评测环境往往是简化版的真实环境。SWE-bench Verified 和 BrowseComp 是两个目前比较可靠的开源评测基准。

  3. SFT 和 RL 的正确分工:SFT 是「启动模型,别让它乱试」——用量少、足够让模型基本能做事就行。SFT 太重会导致模型思维僵化(entropy collapse——模型越训越只会一种答案)。RL 才是「真正提升任务解决智能」——让模型在没见过的新任务上也能探索出解法。

教学价值:这节的内容可以直接作为一个 30 分钟的 lecture。核心叙事线——「Chatbot 时代的训练方法对 Agent 不够用了,为什么、怎么办」。对于任何一个教 Agent 开发的课程,这节的内容是必讲的底层认知。

陈维柱(Microsoft):Training Agentic Models——产品约束下的实战

焦建涛讲的是「理论上怎么训」,陈维柱讲的是「公司里怎么训」——几千张 GPU、sandbox 环境、grader 系统、RL pipeline,把 Agent 训出来并让它活在生产环境里。

产品约束框架:陈维柱提出了一个实用的 4 问框架——拿到一个产品需求后,不问「怎么实现」,先问:

  1. 这个产品承诺用户什么?
  2. 如果它做错,最糟会错在哪?
  3. 用户最在乎的体验是什么?
  4. 产品的 business / UI / infra 限制是什么?

这四个问题的答案直接决定了 grader(评估器)怎么设计、RL 的 reward 函数怎么写。不是技术驱动产品设计,是产品约束驱动训练设计。

核心教训:「没有谁敢说已经找到了最终正确的 Agent 训练算法。」——最好的 RL 目标函数、最好的 on-policy / off-policy 配方、最好的探索机制、最好的 verifier 体系——这些在 2025-2026 年的节点上全部没有共识。目前的做法更像「有效经验」,而不是「最终正确理论」。所以教学的重点不应该是「教一个标准答案」,而是「教一组有用的试探方向和一个健康的怀疑态度」。

教学价值:这节的内容适合作为 Agent 课程的「产业视角」补充——在学生搭完 Agent 原型后,让他们用陈维柱的 4 问框架去审查自己的作品。这 4 个问题对任何实际项目都是直接可用的。


3. HBS AI Lab Phase 1「模仿实验」——通用化改造方案

HBS 的 Phase 1 核心设计:选一家你认为会被 AI 颠覆的公司 → 用 AI 复刻它的核心产品 → 写反思报告(AI 在哪让你 80% 到了、在哪卡住了、这意味着什么护城河)。

这个设计为什么可以被「偷」到任何 AI 课程

因为它的本质不是「学怎么复制别人」,而是「让学习者在实践中自己发现抽象概念的实际含义」。学生不需要被教「护城河」这个词——他们自己会在「我复制了 80% 但剩下的 20% 怎么都做不出来」的体验中,亲身理解什么是护城河。

通用化改造的三个步骤

Step 1:确定模仿对象

不同课程的模仿对象不同:

  • AI 创业课:选一家靠「技术壁垒」起家的公司(SaaS 产品),用 AI 复刻其核心功能
  • AI Agent 开发课:选一个现有的 Agent 产品(客服机器人、代码审查工具),用 Anthropic 5 大模式复刻其核心逻辑
  • AI 教育内容课:选一条现有的优质教育视频,用 AI 工具链复刻(脚本→生成→配音→剪辑全流程)
  • Vibe Coding 课:选一个你日常使用的小工具(番茄钟、habit tracker),用 AI 从零重建

Step 2:定义反思报告的框架

模仿实验的关键不在「复制」,在「反思」。不写反思报告的模仿就是抄作业。反思报告必须回答:

  1. AI 在哪些环节表现超过预期?为什么?
  2. AI 在哪些环节完全失败?失败的根因是什么?(模型能力不行?上下文不够?工具不够?还是这个任务本质上不适合 AI 做?)
  3. 如果给你原始团队十分之一的资源,你能用 AI 做到他们的几成?剩下的差距靠什么填?
  4. 这个产品的护城河在哪?AI 能跨越它吗?

Step 3:设计热身到正课的过渡

Phase 1 的模仿实验最好放在课程的前 20-30%。它的作用是:让学生在进入「正课」之前,先对自己要学的领域的「难度地图」有一个感性认知。当他们听讲座讲到「Prompt Chaining 适合固定步骤的任务」时,会立刻回忆起自己复制某产品时因为步骤太多跑飞了——那个抽象概念有了一个具身的锚点。

注意事项

  • 模仿实验的核心风险是「学生陷入工具泥潭」——搭环境、配 API 花了两天。解决方式:课前提供一键配置好的环境模板。
  • 不要让学生选太大或太复杂的模仿对象——目标公司最好是「单一核心功能」的产品,而不是「平台型」产品。一个好的模仿对象:Notion 的文档编辑器、Superhuman 的邮件 triage 功能。一个坏的模仿对象:整个 Salesforce。

4. 扣子 Coze 对照 Anthropic 5 大模式——实操映射表

这是一个直接可以放进任何 Agent 教学 PPT 的对照表。左边是 Anthropic 的抽象模式,右边是扣子里对应的具体操作。

Anthropic 模式扣子实现操作要点
Prompt Chaining工作流中的「顺序节点」每个节点只做一件事。两个节点之间可以加「条件判断」做验证门(类比 Anthropic 建议的 programmatic gate)
Routing「条件判断」节点 → 多个分支用一个便宜的豆包 Lite 模型做分类节点,分到不同的专业 prompt 分支。路由逻辑 = 意图识别
Parallelization (Sectioning)工作流中的「并行节点」把一个任务拆成多个独立子任务,同时发往不同 LLM 节点,最后用「代码节点」汇总
Parallelization (Voting)多个 LLM 节点 + 「代码节点」汇总让豆包、DeepSeek、GLM 三个模型同时处理同一输入,用代码节点取多数结果
Orchestrator-Workers「大模型节点」→「调用子工作流」中央 LLM 节点先输出子任务列表,然后通过「循环节点」遍历并调用子工作流。⚠️ 扣子目前的子工作流调用有延迟,生产环境需谨慎
Evaluator-Optimizer「大模型节点」→「条件判断」→ 循环LLM 节点生成 → 条件判断节点评估(检查格式/内容/字数)→ 不通过则循环回 LLM 节点重新生成(必须设最大循环次数)
Autonomous Agent「大模型节点」+「循环节点」+ 多工具LLM 在循环中动态选择调用哪个插件(搜索/数据库/API)。必须设最大迭代次数和超时——扣子里叫「循环上限」

教学建议:先在扣子里演示 Prompt Chaining(3 分钟搭完),然后问学生「如果我想让系统自动判断这个输入应该走哪条链,怎么办?」自然引出 Routing。再问「如果我想同时让几个 LLM 做事然后汇总,怎么办?」引出 Parallelization。最后用一个复杂案例演示完整的 Orchestrator-Workers——但一定要加上警告:「这个模式很容易用过头。」

扣子教学的注意事项

  • 扣子的插件描述控制着 Tool Use 的质量,这和 Anthropic 强调的「工具 description 比 prompt 更重要」完全一致。要让学生花时间给每个插件写清晰的 description 和使用示例。
  • 扣子有「循环上限」设置——默认 10 次。必须教学生养成「每次创建循环都手动设置上限和超时」的习惯,这是从原型到生产最基本的安全实践。