导语:当一个 Agent 任务横跨十几个工具调用、几十分钟等待、还可能被人为打断重启,「写一个 while 循环」就不再是答案。2026 年的 Agent 工程栈里,LangGraph、Temporal、Airflow 已经成为三种典型的编排姿势——它们都不是为 Agent 而生,但都在 Agent 浪潮里找到了位置。
核心事件
2026 年上半年,Agent 编排栈出现了明显的「分层与融合」。LangChain 团队继续推进 LangGraph,将「状态机 + Checkpointer + HITL」作为 Agent 长任务的事实标准;Temporal 近期在其 Python SDK 中补齐了 async 支持,并围绕「durable execution」推出一系列 AI 场景内容,把这个后端概念系统性地推向 AI 工程社区;Apache Airflow 在 2.x 系列中持续引入与 DAG 表达相关的新能力(如 dataset 触发、动态 task mapping 等),让传统 ETL 出身的用户能在已有 DAG 体系里编排 LLM 任务。三条路线代表三种工程哲学:图优先、工作流优先、DAG 优先。
这一波变化的本质,是 LLM 应用从「单次调用」演化为「长跑任务」后,工程团队第一次需要严肃面对「状态持久化、失败恢复、可观测性」这三个传统后端问题——而答案不一定要自己造。
技术解析
姿势一:LangGraph——把 Agent 当成状态图
LangGraph 的核心抽象是 `StateGraph`:节点是函数/工具,边是状态转移条件。所有执行状态通过 Checkpointer(MemorySaver、SqliteSaver、PostgresSaver)持久化,使得「中断 → 修改状态 → 恢复」成为一等公民。这种设计天然契合 Agent 的特征——决策树本身就是图,并且经常需要 human-in-the-loop。代价是:开发者必须把业务流程写成图(而非线性代码),对非图灵背景的工程师有学习曲线。
姿势二:Temporal——把 Agent 当成 durable workflow
Temporal 起家于微服务编排,强调「代码即工作流」:你写普通 Python 函数,Temporal SDK 自动记录每一次 await、每一个 activity 调用、每一次外部副作用到 event history。进程崩溃后,重启会从最后一个完成的事件继续。Temporal 几乎不为 AI 而生,但它的「durable execution」正好命中 Agent 痛点:长跑、跨进程、需重试。代价是必须部署 Temporal Server(自托管或 Temporal Cloud),且 Python SDK 对某些异步模式(如 asycio.gather)的封装还不够透明。
姿势三:Airflow——把 Agent 任务当成 DAG 节点
Airflow 是最老牌的工作流引擎,2026 年依然在大量企业 AI 平台里充当「调度层」。它的优势是生态成熟:SLA 告警、丰富的 Operator(HTTP、Python、Sensor)、与 Spark/K8s 的深度集成。把它用于 Agent 编排的典型模式是「DAG 里的某几个 Task 是 LLM 调用」,适合周期性、低交互的 Agent 任务(如每天早上的舆情摘要 Agent)。代价是:Airflow 调度粒度是分钟级,无法做到秒级中断恢复;不适合强交互式 Agent。
关键点
- 按任务时长选:分钟级以下的轻任务 → LangGraph;分钟到小时的中长任务 → Temporal;按天/按周触发的批处理 Agent → Airflow。
- 按状态复杂度选:状态机分支深、需要动态插拔节点 → LangGraph;状态线性、强调事件溯源 → Temporal;状态简单、节点固定 → Airflow。
- 按部署成本选:LangGraph 可单进程(MemorySaver 起步);Temporal 至少需要 Temporal Server + 数据库;Airflow 需要 Scheduler + Worker + Webserver 三件套。
- 按 HITL 需求选:需要「人在回路暂停编辑状态」→ LangGraph 的 `interrupt()` 最自然;TEMP 通过 signal + query 实现但需要额外代码;Airflow 需自建审批 Operator。
- 可观测性:LangGraph 配 LangSmith,Temporal 自带 Web UI 与 event history replay,Airflow 自带 Gantt + Log + 第三方插件。三者都满足生产级追踪,但调试体感差别巨大。
- 不要把 Airflow 当 Agent runtime 用:它设计目标是调度而非 runtime,长跑任务会在 slot 占用、heartbeat、僵尸进程上踩坑。
- 混合架构是常态:2026 年生产环境里常见「Temporal 管 durable 部分,LangGraph 管决策图,Airflow 管日级调度」三层组合,不要迷信单一银弹。
行业影响
Agent 编排正在从「框架之争」演化为「栈之争」——头部团队普遍采用 2-3 个编排引擎组合,而不是选一个万能框架。与此同时,传统后端领域的「durable execution」「event sourcing」概念正在被 AI 工程社区重新发现,这是一次跨领域的双向学习。下一波值得关注的方向是:Temporal 推出 AI-native SDK、LangGraph 强化跨语言支持(Go/Rust)、以及可能出现的「LLM-native orchestrator」(用自然语言直接描述工作流,由编译器生成可执行图)。
结语
选 Agent 编排框架不是选 IDE,而是选一个长期绑定的工程哲学。图优先(LangGraph)、工作流优先(Temporal)、DAG 优先(Airflow)三者各有清晰的适用场景,硬把它们做成替代关系反而会陷入不必要的复杂度。看清自己任务的时长、状态复杂度、人机交互密度,往往比看哪个框架更「AI 原生」更管用。
参考资料
官方文档
- LangGraph Overview [200] - 状态图与 Checkpointer 基础
- Temporal Python SDK [200] - durable execution 入门
- Airflow Core Concepts [200] - DAG 与 Task 概念
- Temporal Blog: What is durable execution [200] - durable execution 核心概念白皮书
- Temporal Dev Guide Python [200] - Temporal Python 开发指南
开源项目
- langchain-ai/langgraph [200] - GitHub 状态图框架主仓库
- temporalio/sdk-python [200] - Temporal Python SDK 官方仓库
- apache/airflow [200] - Apache Airflow 主仓库
- langgraph/examples [200] - 官方示例集(multi-agent / HITL / persistence)
行业报道
- LangChain Blog: LangGraph tag [200] - 官方博客 LangGraph 标签聚合
- Anyscale Blog [200] - LLM 工程长文站
- The New Stack [200] - 后端与 AI 工程媒体入口
社区讨论
- HN Algolia: agent orchestration [200] - 持续聚合的社区讨论
对比基准 / 可观测性
- LangSmith Observability [200] - LangGraph 应用追踪
- Temporal Web UI [200] - workflow 历史回放
- Airflow Logging & Monitoring [200] - 调度监控指标


本文由 AI 生成。内容基于公开资料整理,可能存在事实偏差,引用链接请以原始来源为准。
