多 Agent 学习路径:从 0 到生活金融实战
我来给你做一份系统的多 Agent 学习路径。先查一下你手上几个工具的最新状态,确保信息准确。信息齐了。我给你设计一份8 周可执行的学习路径,从心智模型到实战项目都覆盖,包含可运行代码。文档已生成。这份教程的特点是8 周可执行、每周有交付,不是看完就忘的清单。
几个值得你优先关注的设计:
- 工具定位明确 —— 五个工具不是平行学,而是分三层:应用层(Claude Code / Codex)、框架层(CrewAI / LangGraph)、引擎层(DeepSeek)。DeepSeek 当"廉价工人"配合框架,能把成本压到 Claude 直接调用的 1/10。
- Windows 11 专门做了适配 —— 强烈建议你用 WSL2,文档里给了完整的环境配置命令,包括 uv(比 pip 快 10–100 倍)、tmux(Agent Teams 分屏必需)、nvm 这一套。
- 学习顺序有讲究 —— 先 Claude Code Agent Teams(你已经会了)→ Codex Subagents(对照视角)→ CrewAI(20 行出 demo)→ LangGraph(生产级)。每一步都有具体的可运行代码。
- 实战项目按你的需求分了 4 类 —— 工作(周报 / PR Review / 文档)、金融(股票研究 / 记账 / 套利监控)、生活(旅行 / 体检解读)、决策(辩论式决策器是我最推荐的,能治"确认偏误")。
- 代码示例可直接跑 —— Week 4 的 CrewAI 股票分析 demo 和 Week 6 的 LangGraph Reflexion 写作 demo 都是完整代码,复制就能用 DeepSeek 跑起来。
给你的执行建议:
- 别想着一周看完 8 周内容。每周就完成那一周的最小交付,做不完就拖一周。
- Week 4 那个 CrewAI 股票分析的 demo 强烈建议第一周末就跑一遍 —— 跑通会有巨大的正反馈。
- 项目 D1(辩论式决策助手)是我个人认为对 28 岁这个年纪 ROI 最高的应用 —— 这个年纪要做的大决定(跳槽、买房、是否定居某城市)特别多,多 Agent 强行让对立观点同台比单纯找朋友聊靠谱得多。
需要我把 Week 4 那个 CrewAI demo 或者 Week 6 那个 LangGraph demo 单独抽出来做成可直接 git clone 的项目骨架吗?或者你想先深入哪个实战项目(W1–D2),我可以再单独写一份详细实现方案。
适用对象:28 岁程序员,Windows 11,有 Claude Code、Codex CLI、DeepSeek API、CrewAI、LangGraph 学习周期:8 周(每周 5–8 小时) 目标:从理解概念到能独立用多 Agent 解决工作、金融、生活的真实问题
序:先回答三个问题
1. 为什么 28 岁程序员该学多 Agent?
不是因为它酷,而是因为接下来 3 年,"独立调度多个 AI 完成长任务"会成为程序员的基本功,就像 10 年前的版本控制。掌握它意味着你能:
- 把一个人 1 周的活压到 1 天
- 把"研究 + 写代码 + 测试 + 复盘"这种串行任务并行化
- 不只是 coding,还能用同一套思维解决投资研究、人生决策等问题
2. 这五个工具我都要学吗?
不需要全部精通。它们分两类,定位不同:
- 应用层(开箱即用):Claude Code、Codex CLI —— 终端里的多 Agent IDE
- 框架层(自己造):CrewAI、LangGraph —— 用代码搭建自己的 Agent 系统
- 引擎:DeepSeek API —— 便宜的 LLM,给框架层省钱用
3. Windows 11 能不能玩?
可以,但强烈建议用 WSL2(Ubuntu)。原生 PowerShell 跑得动 Codex 和 Python,但 tmux、多终端、Unix 工具链会让你舒服十倍。下面所有命令默认在 WSL2 中执行。
第 1 章:你手上的兵器谱
理清每件武器的位置,才知道什么场合掏哪把。
| 工具 | 类型 | 强项 | 弱项 | 我用它做什么 |
|---|---|---|---|---|
| Claude Code | 应用层 + Agent Teams | 长任务推理、代码质量、Agent Teams 原生支持 | Token 贵、Windows 需 WSL | 真实项目的核心开发 |
| Codex CLI | 应用层 + Subagents | GPT-5.x、原生 Windows 沙箱、Codex App 桌面端 | 多 Agent 灵活性稍弱于 Claude Code | 第二意见、和 Claude Code 对照验证 |
| DeepSeek API | LLM 引擎 | 极便宜(约为 Claude 的 1/10–1/20)、中文好 | 不如 Claude/GPT 强 | CrewAI / LangGraph 里跑"廉价工人" |
| CrewAI | Python 框架 | 上手快(~20 行代码出 demo)、角色比喻直观 | 复杂分支、长任务、可观测性较弱 | 原型、线性多 Agent 工作流 |
| LangGraph | Python 框架 | 图结构、可恢复、生产级 | 学习曲线陡、~60+ 行起步 | 真正要上线的、复杂分支/循环的系统 |
一句话决策:
- 写代码 → Claude Code 主,Codex 辅
- 探索 / 原型 → CrewAI + DeepSeek
- 上线 / 复杂 → LangGraph + Claude/GPT
- 钱不够 → 哪都换成 DeepSeek
第 2 章:Windows 11 环境准备(一次配好)
2.1 装 WSL2 + Ubuntu
# PowerShell 管理员模式
wsl --install -d Ubuntu-22.04
# 重启后设置用户名密码2.2 装 Python 工具链(用 uv,比 pip 快 10–100 倍)
# 在 Ubuntu 终端
curl -LsSf https://astral.sh/uv/install.sh | sh
source ~/.bashrc
# 验证
uv --version2.3 装 Node + Claude Code + Codex CLI
# Node 通过 nvm
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.1/install.sh | bash
source ~/.bashrc
nvm install --lts
# Claude Code
npm install -g @anthropic-ai/claude-code
# Codex CLI
npm install -g @openai/codex2.4 装 tmux(多 Agent 分屏必需)
sudo apt update && sudo apt install -y tmux2.5 配置 API Keys
把下面的 keys 放在 ~/.bashrc(注意:实际值不要提交到 Git):
export ANTHROPIC_API_KEY="sk-ant-..." # Claude Code 也支持 ChatGPT/Pro 登录
export OPENAI_API_KEY="sk-..."
export DEEPSEEK_API_KEY="sk-..."
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1source ~/.bashrc2.6 选个 IDE
VS Code + Remote-WSL 插件,让你在 Windows 的 VS Code 里直接编辑 WSL 里的代码。这是 Win11 玩 AI 开发最舒服的姿势。
第 3 章:8 周学习路径
我建议把学习当成"每周一个最小可炫耀成果",而不是"看完一本书"。
Week 1:建立心智模型(不写代码)
目标:能 5 分钟内向朋友讲清楚什么是多 Agent,什么时候该用、不该用。
该看的:
- 通读 Anthropic 的 Building effective agents 一文(中文翻译网上很多)
- 通读 Claude Code Agent Teams 文档
- 看 OpenAI 的 Codex Subagents 概念文档
该想的(用一张纸写下来):
- 单 Agent 何时够用?
- 多 Agent 何时反而拖累?
- "并行" vs "通信" vs "辩论"是三件不同的事
本周交付:一份 500 字笔记,回答上面三个问题。
Week 2:玩透 Claude Code Agent Teams
目标:能不查文档独立组队完成一个真实任务。
练习清单:
- 第一团(探索类,最安全):让 Claude Code 组 3 人团队评审你 GitHub 上一个老项目的代码质量(安全/性能/可维护性各一人)。
- 第二团(调试类):找一个真实 bug,用 5 人对抗式假设调查(参考 Agent Teams 文档里的 "scientific debate" prompt)。
- 第三团(实现类):在一个小项目上跑前端 + 后端 + 测试 3 人团队,明确文件边界。
关键技能点:
Shift+Tab开 plan mode、再Shift+Tab开 delegate modeCtrl+T看任务列表Shift+Down切换队员- 在 spawn prompt 里写清"文件边界"和"质量标准"
本周交付:3 段实战录屏(自己看就行),每段 5 分钟内。
Week 3:Codex CLI 第二意见 + Subagent 工作流
目标:理解为什么"两个不同的 AI 互相 review"比"一个 AI 自己审查"靠谱得多。
练习:
# 一个典型的 cross-check 工作流
# 1. 让 Claude Code 实现一个功能
claude
> "实现一个 LRU 缓存,要求 O(1) 的 get 和 put"
# 2. 让 Codex 审查
cd <project>
codex
> "Review the LRU cache implementation. Find correctness bugs, edge cases, and performance issues. Don't trust the existing tests."进阶:用 Codex 的 Subagents 功能 创建自定义角色(.codex/agents/reviewer.toml),把"安全审查员"、"性能分析师"做成可复用模板。
本周交付:一套 .codex/agents/ 模板和一套 Claude Code 的 .claude/agents/ 模板,至少各 3 个角色。
Week 4:CrewAI + DeepSeek(最便宜的入门框架)
目标:能用 Python 代码搭一个 3 Agent 团队,从零跑到出结果。
安装:
mkdir multi-agent-lab && cd multi-agent-lab
uv venv && source .venv/bin/activate
uv pip install crewai crewai-tools python-dotenv最小可运行示例(保存为 crew_demo.py):
"""
3 人团队分析一只股票:
- 数据员收集基本信息
- 分析师评估优劣
- 反方挑刺
DeepSeek 当大脑,便宜。
"""
import os
from dotenv import load_dotenv
from crewai import Agent, Task, Crew, LLM
load_dotenv()
# 用 DeepSeek 做 LLM(OpenAI 兼容协议)
llm = LLM(
model="deepseek/deepseek-chat",
api_key=os.getenv("DEEPSEEK_API_KEY"),
base_url="https://api.deepseek.com",
)
researcher = Agent(
role="股票数据研究员",
goal="收集目标公司的关键财务数据和近期新闻",
backstory="资深券商研究员,习惯只看数据不下结论。",
llm=llm,
verbose=True,
)
analyst = Agent(
role="多头分析师",
goal="基于数据找出该公司的投资亮点和增长逻辑",
backstory="偏成长股的买方分析师,擅长发现优势。",
llm=llm,
verbose=True,
)
devil = Agent(
role="空头分析师",
goal="找出该公司被市场忽视的风险和估值陷阱",
backstory="挑刺王,永远问'如果错了会怎样'。",
llm=llm,
verbose=True,
)
# 任务定义
t1 = Task(
description="研究 {ticker} 的近 4 个季度财报、营收增速、毛利、现金流",
agent=researcher,
expected_output="一份结构化数据简报(中文)",
)
t2 = Task(
description="基于研究简报,给出 3 个最强的多头逻辑",
agent=analyst,
expected_output="三条带数据支撑的多头论点",
context=[t1],
)
t3 = Task(
description="基于研究简报和多头论点,找出 3 个最强反驳",
agent=devil,
expected_output="三条带数据支撑的空头论点",
context=[t1, t2],
)
crew = Crew(agents=[researcher, analyst, devil], tasks=[t1, t2, t3], verbose=True)
if __name__ == "__main__":
result = crew.kickoff(inputs={"ticker": "NVDA"})
print("\n=== 最终输出 ===\n", result)跑起来:
python crew_demo.py该体会的:
- 任务之间的
context=[t1]是怎么传递信息的 - 每个 agent 的
role/goal/backstory怎么影响输出 - DeepSeek 的成本(这个 demo 跑一次大约 ¥0.1–0.5)
本周交付:把上面的 demo 改成你真正想分析的东西(你的工作领域、一只你关心的股票、一个产品想法)。
Week 5:CrewAI 进阶(工具 + 记忆 + 流程类型)
目标:让 Agent 能用工具(搜索、读文件、调 API),并理解 3 种内置流程。
关键概念:
| 流程类型 | 说明 | 何时用 |
|---|---|---|
Sequential | 任务一个接一个 | 默认、最简单 |
Hierarchical | 经理 Agent 协调 | 有明显层级 |
Consensual(共识) | 多 Agent 共同决策 | 投票式决策 |
练习:给 Agent 加上联网搜索能力,让它分析实时数据(不再依赖训练时知识)。
from crewai_tools import SerperDevTool # 需要 SERPER_API_KEY,免费 2500 次
search = SerperDevTool()
researcher = Agent(
role="...",
goal="...",
tools=[search], # 关键加这一行
llm=llm,
)本周交付:一个带网络搜索能力的 3 Agent 团队,能分析真实世界的事件(不再是训练数据里的事)。
Week 6:LangGraph(生产级的关键一步)
目标:理解 CrewAI 解决不了什么、LangGraph 怎么解决。
两个框架的本质区别:
- CrewAI:你描述"谁做什么",框架决定执行顺序
- LangGraph:你画一张图,节点是 Agent,边是条件,状态在节点间流动
什么时候非用 LangGraph 不可:
- 任务有循环(写代码 → 测试 → 失败 → 改 → 测试……)
- 需要人在回路(HITL)的审批节点
- 需要断点续跑(任务跑了一半电脑死机,能从中间状态恢复)
- 需要结构化状态(不只是字符串传来传去)
安装:
uv pip install langgraph langchain langchain-openai最小示例(保存为 lg_demo.py)—— 一个会自己反思和重试的写作 Agent:
"""
LangGraph 经典模式:Reflexion(写 → 评 → 改)
"""
from typing import TypedDict, Annotated
from langgraph.graph import StateGraph, START, END
from langchain_openai import ChatOpenAI
# DeepSeek 走 OpenAI 兼容
llm = ChatOpenAI(
model="deepseek-chat",
base_url="https://api.deepseek.com",
api_key=__import__("os").getenv("DEEPSEEK_API_KEY"),
)
# 状态:在节点间传递的"白板"
class State(TypedDict):
topic: str
draft: str
critique: str
iteration: int
def write(state: State) -> dict:
prompt = f"写一篇 300 字的短文,主题:{state['topic']}"
if state.get("critique"):
prompt += f"\n\n上一稿的问题:{state['critique']}\n请改进。"
draft = llm.invoke(prompt).content
return {"draft": draft, "iteration": state.get("iteration", 0) + 1}
def critique(state: State) -> dict:
prompt = f"严格批评下面这篇短文,指出 3 个最大问题。如果已经很好,回复 GOOD:\n\n{state['draft']}"
fb = llm.invoke(prompt).content
return {"critique": fb}
def should_continue(state: State) -> str:
if "GOOD" in state["critique"].upper() or state["iteration"] >= 3:
return END
return "write"
# 建图
g = StateGraph(State)
g.add_node("write", write)
g.add_node("critique", critique)
g.add_edge(START, "write")
g.add_edge("write", "critique")
g.add_conditional_edges("critique", should_continue, {"write": "write", END: END})
app = g.compile()
if __name__ == "__main__":
result = app.invoke({"topic": "为什么 28 岁是学习多 Agent 最好的年纪", "iteration": 0})
print("\n=== 最终稿 ===\n", result["draft"])
print(f"\n(共迭代 {result['iteration']} 次)")该体会的:
- "节点 + 边 + 状态" 的图结构
- 条件边 (
add_conditional_edges) 怎么实现循环 - 最多 3 次迭代是怎么硬控制住成本的
本周交付:把 Reflexion 模式套到自己的真实任务上(例如写邮件、写周报、写代码、写决策备忘录)。
Week 7:组合拳——把所有工具配合起来
目标:用一个真实项目证明你掌握了。
推荐项目:「个人投资研究助手」(金融场景)
LangGraph 主图
├─ 数据收集子图(CrewAI 3 人小队,跑在 DeepSeek 上,便宜)
│ ├─ 财报员
│ ├─ 新闻员
│ └─ 情绪员
├─ 分析节点(Claude/GPT,贵但靠谱)
│ └─ Reflexion 循环:分析→批评→改→再分析
├─ 人在回路节点(你 review)
└─ 决策记录节点(写入本地 SQLite,能回溯)为什么这么搭?
- 数据收集要并行、用便宜模型 → CrewAI + DeepSeek
- 关键分析要深度推理 → Claude/GPT
- 整体流程要可中断、可恢复 → LangGraph
- 决策可追溯 → 本地数据库
本周交付:一个能跑、有日志、有断点续跑能力的真实工具。
Week 8:复盘 + 选定主战场
目标:从"什么都会一点"进阶到"有一个领域能交付"。
回答自己:
- 哪个工具我用着最顺手?
- 我最想用多 Agent 解决的真实痛点是什么?
- 接下来 3 个月做哪个具体项目,能让我的简历多一行?
挑一个方向沉下去 —— 这才是把学习转化为筹码的关键。
第 4 章:心智模型与协作模式
光会写代码不够,得理解几种核心模式。
4.1 五种多 Agent 协作模式
| 模式 | 形态 | 典型场景 | 推荐工具 |
|---|---|---|---|
| 并行分工 | 任务可拆,无依赖 | 给项目同时写前/后/测 | Claude Code Agent Teams / CrewAI |
| 管道接力 | A 输出是 B 输入 | 调研→分析→写报告 | CrewAI Sequential |
| 辩论 / 对抗 | 多方观点互相反驳 | 投资决策、争议判断 | CrewAI + 自定义 prompt |
| 反思循环 | 自己生成→自己批评→改 | 写作、代码、设计 | LangGraph |
| 层级管理 | 经理分配、员工执行 | 复杂项目、长任务 | LangGraph Supervisor / CrewAI Hierarchical |
4.2 何时不要用多 Agent
诚实的负面清单:
- 任务能 1 个 prompt 解决("帮我改个变量名")
- 任务高度串行(每步都依赖上一步严格输出)
- 你没有清晰的拆分思路(多 Agent 会放大混乱,不会消除)
- 预算紧张但任务不重要(多 Agent token 成本是 3–10 倍)
4.3 多 Agent 的反模式(新手最容易踩的坑)
- 角色混乱:两个 Agent 职责重叠 → 输出互相打架
- 指令稀薄:每个 Agent 只有一句 backstory → 平庸输出
- 无文件边界:实现类任务里两个 Agent 改同一文件 → 互相覆盖
- 无质量门:没有验收标准,Agent 自我感觉良好就交工
- 过度并行:把 3 步串行任务硬拆成 3 个 Agent → 协调成本超过收益
- 盲信输出:多 Agent 互相 echo chamber → 一致地错
第 5 章:实战项目库
下面 8 个项目按"工作 / 金融 / 生活 / 决策"分类,每个都标注了推荐工具栈。挑你最痛的先做。
工作场景
项目 W1:日报 / 周报自动生成
痛点:每周花 1–2 小时写周报。 栈:CrewAI + DeepSeek 结构:
- Agent 1:从 Git commit / GitHub PR 读取本周工作
- Agent 2:从日历读取本周会议
- Agent 3:综合输出周报草稿
- 你:5 分钟微调发出
项目 W2:代码 PR 自动 Review 机器人
痛点:团队 PR 排队等审,自己审又累。 栈:Claude Code Agent Teams(3 个审查角色) 结构:参考 Agent Teams 文档里 PR #142 那个例子。 升级:用 GitHub Actions 触发,自动评论 PR。
项目 W3:技术文档生成器
痛点:写文档烦,更新文档更烦。 栈:LangGraph + Claude 结构:
- 节点 1:扫代码、抽 API 签名
- 节点 2:生成文档草稿
- 节点 3:Reflexion 循环(写 → 评 → 改)
- 节点 4:人审
金融场景
项目 F1:A 股 / 美股研究助手(前面 Week 7 那个)
痛点:研报噪音多,多空逻辑混在一起。 栈:LangGraph(主) + CrewAI(数据收集) + DeepSeek + Claude/GPT 输出:每只股票一份多空辩论记录 + 自己的最终判断。
项目 F2:个人记账分析师
痛点:每月花钱稀里糊涂。 栈:CrewAI + DeepSeek 结构:
- Agent 1:分类工 —— 把账单按类目归类
- Agent 2:诊断师 —— 找异常和趋势
- Agent 3:教练 —— 提下个月调整建议
数据来源:导出银行/支付宝/微信账单 CSV 喂给它。
项目 F3:可转债 / ETF 套利监控
痛点:手动盯盘累。 栈:LangGraph + 定时任务(cron 或 Windows 任务计划) 结构:
- 节点 1:拉行情
- 节点 2:算价差
- 节点 3:触发条件就发邮件 / 微信通知
⚠️ 重要提醒:任何投资决策最终由你拍板,多 Agent 只是降低信息处理成本,不替你担风险。
生活场景
项目 L1:旅行行程规划师
栈:CrewAI + 搜索工具 结构:
- 攻略员:搜目的地必去
- 物流员:规划交通和住宿
- 预算员:估总花费
- 你:调整后导出 Google Maps
项目 L2:体检报告解读助手
痛点:报告全是术语看不懂。 栈:CrewAI(注意:仅作教育用途,不替代医生) 结构:
- 翻译员:术语翻译成人话
- 解释员:每个指标偏离的可能原因(多个假设)
- 行动员:给出问医生时该问的 5 个问题
决策场景
项目 D1:辩论式决策助手(最重要的一个)
这是多 Agent 最被低估的用法 —— 代替你做"魔鬼代言人"。
栈:CrewAI + DeepSeek(决策大事时换 Claude/GPT) 结构:
# 用法示例:你纠结要不要跳槽
agents = [
Agent(role="支持方", goal="找出跳槽的 5 个最强理由"),
Agent(role="反对方", goal="找出留下的 5 个最强理由"),
Agent(role="数据派", goal="把双方观点量化成可比较的指标"),
Agent(role="时间机器", goal="假设 5 年后回看,最可能后悔什么?"),
]为什么有效:人脑天生有"确认偏误",会优先记得支持自己倾向的信息。多 Agent 强行让对立观点同台亮相,比你自己想清楚得多。
适用决策:
- 跳槽 / 转行
- 买房 / 租房
- 大额消费(车、设备)
- 创业方向选择
- 是否结婚 / 生孩子(认真的,这种事尤其值得辩论式分析)
项目 D2:长期目标拆解器
栈:LangGraph 结构:把"5 年内成为独立开发者"拆成 → 年目标 → 季度 OKR → 月任务 → 周任务,每层都有 Agent 评审现实可行性。
第 6 章:黄金最佳实践(综合提炼)
6.1 关于成本
- 分层用模型:协调用最强模型,执行用便宜模型(DeepSeek 是省钱大杀器)
- 永远先 plan 后 run:plan 多花 5 分钟,run 少花 5 美元
- 设硬性预算:CrewAI 和 LangGraph 都支持 max_iterations、max_execution_time
- 本地缓存:相同 prompt 缓存结果(LangChain 有
set_llm_cache) - 晚上跑大任务:DeepSeek 夜间半价(约 16:30–00:30 UTC)
6.2 关于质量
- 角色要锐利:宁可一个角色专精一件事,不要一人兼三职
- 指令要具体:与其"做得专业一些",不如"用 3 段、每段含 1 个数据点"
- 强制结构化输出:让 Agent 返回 JSON 而不是散文,下游处理才稳
- 加质量门:每个 Agent 输出后,有一个 validator Agent 检查
- 保留人在回路:高风险决策一定留人审批节点
6.3 关于工程
- 从 CrewAI 开始,但不要止步于 CrewAI
- 任何上线的东西用 LangGraph:状态可序列化、断点可恢复
- 日志贼重要:用 LangSmith(LangChain 出品)或自己写 trace
- 版本控制 prompt:prompt 当代码管理,进 Git
- 失败重试要带退避:3 次重试,间隔 1s / 5s / 30s
6.4 关于自己
- 每周复盘一次:哪个 Agent 表现差?是 prompt 问题还是模型问题?
- 建模板库:把好用的 Agent 配置存到
~/agents-templates/反复用 - 保持手感:每两周做一个新小项目,不要只优化老的
- 找一个伙伴或群:多 Agent 这事一个人琢磨容易钻牛角尖
第 7 章:避坑清单(血泪经验)
Windows 11 特有的坑
- ❌ 直接在 PowerShell 跑 tmux —— 装不上,去 WSL2
- ❌ 路径用反斜杠 —— WSL 里要用
/不是\ - ❌ 中文乱码 —— 在
~/.bashrc加export LANG=zh_CN.UTF-8 - ❌ VS Code 在 Windows 端编辑 WSL 文件 —— 用 Remote-WSL 插件,否则慢且 CRLF 会爆炸
- ❌ DeepSeek 国内访问慢 —— 直连一般够用,企业版可配代理
工具使用的坑
- ❌ Claude Code 长任务跑 30 分钟无人看管 → 烧钱 + 跑偏
- ❌ CrewAI 在
Hierarchical模式下没设 manager_llm → 默认会用 GPT-4 → 账单惊喜 - ❌ LangGraph 状态用了
list但忘了用Annotated配 reducer → 状态被覆盖 - ❌ Codex 和 Claude Code 同时跑同一个 repo → 互相踩脚(用 git worktree 隔离)
- ❌ 把 API key 写进代码 commit 上去 → 立即吊销、用 dotenv
心态的坑
- ❌ "我得把 5 个工具都精通才开始做项目" → 边做边学,3 周就动手
- ❌ "Agent 出错就不靠谱" → Agent 像新人实习生,要 review 要带教
- ❌ "多 Agent = 智能涌现" → 没有,主要是分工和并行,别神化
- ❌ "我学完这些就能造 AGI 了" → 你能造的是更顺手的工作流,足够了
第 8 章:持续学习资源(按重要性排序)
必读
- Anthropic — Building Effective Agents:https://www.anthropic.com/research/building-effective-agents
- Claude Code Agent Teams:https://code.claude.com/docs/en/agent-teams
- OpenAI Codex Subagents:https://developers.openai.com/codex/subagents
- LangGraph 官方教程:https://langchain-ai.github.io/langgraph/tutorials/
- CrewAI 文档:https://docs.crewai.com
建议追
- Anthropic Engineering Blog:长任务、记忆系统的硬核工程文章
- LangChain Blog:LangGraph 实战案例
- DeepLearning.AI 短课:Andrew Ng 出的 1–2 小时多 Agent 短课,量大管饱
- X / Twitter:搜
#multiagent+ 关注 LangChainAI、CrewAIInc、AnthropicAI
反向资源(保持清醒)
- 多 Agent 失败案例:搜 "multi-agent failure modes"
- 简单胜过复杂:Anthropic 也强调,能用单 agent 别上多 agent
终章:给 28 岁程序员的几句话
- 多 Agent 不是终点,是工具。学会它是为了让你能做以前不敢接的活儿,不是为了简历上多一行 buzzword。
- 工程能力 > 框架熟练度。框架半年就换一茬,但"如何拆分一个复杂任务、如何设计可恢复的流程、如何让 AI 输出可验证",这些迁移到任何技术都有用。
- 挑一个真痛点。把多 Agent 用在你真正头疼的问题上 —— 自动化你的周报、研究你的股票、辅助你的决策 —— 学习动力会大得多。
- 保留判断力。Agent 越自动,你的判断越重要。技术能并行,责任不能。
- 8 周后,你不会成为"多 Agent 专家",但你会成为**"知道什么时候该用、什么时候不该用,并且能上手就做"的程序员**。这就足够让你和 90% 的同行拉开距离。
开始 Week 1 吧。
本指南整合了 Claude Code、Codex、CrewAI、LangGraph 截至 2026 年 5 月的官方文档与最佳实践。技术演进很快,请定期回看官方更新。