这是「AI 观察室」FDE(Forward Deployed Engineer / 前线部署工程师)系列第 9 篇。今天我们不再看 Palantir 的 FDE 神话,而是拆解 2026 年**真正靠 FDE 撑起商业模型**的三家 AI Infra 公司:Scale AI、Baseten、Sierra。
引子:当「FDE」变成一个被所有人抢的词
如果你在 2025-2026 年打开 LinkedIn,会看到一个奇怪的现象:几乎每一家 AI 公司都在招 Forward Deployed Engineer。从 Palantir、Anthropic、OpenAI,到 Scale AI、Baseten、Sierra、Decagon、Harvey,再到国内的阿里通义、字节火山、月之暗面,「FDE」这个原本只在 Palantir 内部流通的工种,已经变成 2026 年最卷的 AI 招聘关键词。
但如果你细看每家公司的 JD,会发现它们写的「FDE」是三个完全不同的工种:
- Scale AI 招的 FDE,**简历上要写国防部 clearance**,主要解决政府客户的「数据 + 部署 + 长期运维」三件套;
- Baseten 招的 FDE,本质是**推理工程师 + 性能优化专家**,主要解决「P99 latency 不达标」「GPU 成本爆表」这种纯工程问题;
- Sierra 招的 FDE(他们叫 **Agent Strategist**),更像**半个咨询顾问 + 半个产品经理 + 半个工程师**,负责「把客户的 CX 流程拆解、画 ontology、然后上线一个 agent」。
为什么同一顶帽子戴在三种人头上?这背后是 AI Infra 公司三种完全不同的商业模型决定的:Scale AI 卖「数据 + 部署服务」、Baseten 卖「推理平台」、Sierra 卖「outcome-based 的 agent 订阅」。商业模型不同,FDE 的工作内容、招聘门槛、考核指标就完全不一样。
今天这篇文章,我们就用三家公司的官方文档、招聘页与公开案例,把这三种 FDE 模型拆个底朝天。
核心现象:AI Infra 公司的 FDE 正在「三分天下」
现象 1:HFS Research 的判断 —— FDE 是企业 AI 的「执行层」
2026 年 3 月 9 日,HFS Research 发布了一份标题为《Stop treating FDE as optional: Your AI Flywheel will not spin without it》的报告(HTTP 200 可访问:hfsresearch.com/research/fde-optional-ai-flywheel-spin)。报告的核心观点是:
93% of enterprises are stuck in AI pilot purgatory. The missing layer is not better models or bigger budgets. It is forward deployed engineering, and the firms that crack it at scale will own the recurring revenue layer of enterprise AI.
HFS 把 FDE 定义为「The Services-as-Software flywheel requires an embedded execution layer that connects these technologies inside real operational systems」——即把 LLM、Agentic AI、Vibe Coding 这些「加速器」真正接入到企业生产系统的「嵌入式执行层」。
这就是为什么 2026 年几乎所有 AI Infra 公司都在抢 FDE:因为 FDE 是唯一能把 demo 变成 production、把 pilot 变成 recurring revenue 的人。
现象 2:HN 上的「FDE 招聘难」正在成为公共话题
2026 年 3 月 27 日,HN 上出现了两个几乎同一时间发布的 Ask HN 帖子:
- Ask HN: What's the Deal with Forward Deployed Engineers? — 一位招聘者说:「We're hiring Forward Deployed Engineers at my company but can't seem to find the combo of strong coding chops + customer-facing experience we need.」
- Ask HN: Why is the term forward deployed engineer (FDE) popular all of a sudden? — 另一位讨论者问为什么这个 Palantir 的「内部行话」突然变成了全行业的招聘热词。
两个帖子的潜台词是:FDE 的人才标准在企业内部根本没人搞清楚。一家公司想要「coding chops + customer-facing experience」的混合体,但这种人市场上几乎不存在。
现象 3:开源社区已经把 FDE 列为正式职业
GitHub 上目前 star 最高的 FDE 主题 repo 是 pierpaolo28/Awesome-FDE-Roadmap(API 可达 501 stars,2026-06-25 更新),其描述直接写:
🚀 The definitive roadmap to becoming a Forward Deployment Engineer (FDE). Master AI Agents, Enterprise Data Architecture, and Strategic Consulting. Bridging the gap between HQ and the field. **Inspired by the "Delta" role at Palantir, OpenAI, and Scale AI.**
另一份中文仓库 yeasy/forward_deployed_engineering_guide(API 可达)则把它翻译成「前线部署工程最佳实践指南」。
FDE 已经从「Palantir 内部黑话」变成「全球开发者社区公认的 AI 时代核心工种」。
深度解析:三家公司的三种 FDE 模型
一、Scale AI 派 —— 政府/国防导向的「全栈部署工程师」
Scale AI 的 FDE 客户结构:以美国国防部、情报机构、U.S. Air Force、U.S. Army 等政府客户为主。这些客户的特点是:
1. 有保密要求(需要 clearance);
2. 有 legacy 系统(on-premise、不能上公有云);
3. 决策链极长(一个 PoC 可能要 6 个月);
4. 预算稳定(不差钱,但流程慢)。
Scale AI 的 FDE 工作内容(基于 pierpaolo28/Awesome-FDE-Roadmap 中「Scale AI Delta role」的描述):
- 嵌入式驻场:在客户现场驻场数周到数月;
- 数据 pipeline 搭建:在客户内网搭建从「数据采集 → 标注 → 训练 → 部署」的全链路 pipeline;
- 模型微调与部署:把 Scale 的基础模型针对客户场景做 LoRA / SFT,并在客户的 on-prem GPU 上部署;
- 长期运维:上线后还要持续 1-2 年的监控、retraining、re-evaluation。
招聘门槛:
- **Top 5% 的工程能力**(能独立从 0 搭 pipeline);
- **保密资质**(active clearance 是加分项,没有也能进,但有的话直接 senior);
- **能接受长期出差**(政府项目通常 100% on-site);
- **能写能说**(要直接面对客户的军方 PM 和工程师)。
为什么叫「Delta role」:Scale AI 把 FDE 叫做「Delta role」,意思是「连接 Scale AI 总部和客户现场的关键增量」。这个名字被多个 repo 直接引用,已经成为 FDE 社区的标准术语之一。
二、Baseten 派 —— 推理工程导向的「性能优化专家」
Baseten 的 Embedded Engineering 页面(HTTP 200)原话:
Get deep inference-specific expertise with our forward-deployed engineers. They literally spend all of their time optimizing deployments.
Our forward deployed engineers work as an extension of your team to define and hit your required performance metrics.
注意这里的关键词:"inference-specific"、"optimizing deployments"、"performance metrics"。Baseten 的 FDE 几乎不和客户聊业务,只和工程团队聊 P99 latency、GPU 成本、autoscaling 策略。
Baseten 的 FDE 工作内容:
- **模型优化**:把客户的开源模型(Llama、Qwen、DeepSeek)做量化(FP8 / INT4)、kernel fusion、speculative decoding;
- **推理架构设计**:在 Truss(Baseten 的开源部署框架)上搭建 multi-model pipeline,处理 batching、caching、prefill-decode 分离;
- **性能调优**:把客户的 P99 latency 从 800ms 优化到 200ms,把 GPU 成本砍掉一半;
- **生产稳定性**:oncall、scaling 策略、failure mode 分析。
Baseten 的 FDE 客户结构(基于其官方客户列表):Cursor、Clay、Decagon、Descript、Gamma、Harvey、Hebbia、Heygen、Lovable、Mercor、Notion、OpenEvidence、Sourcegraph、Speechify、Writer、World Labs 等 30+ 家 AI-native 应用公司。这些公司不在乎 FDE 懂不懂他们的业务,只在乎「我的 P99 latency 能不能压到 200ms 以下」。
招聘门槛:
- **扎实的 ML Systems 背景**(CUDA / Triton / vLLM 经验是加分项);
- **对 GPU 性能有「神经病级」的敏感度**(能看出 5% 的 latency 差异来自哪里);
- **不需要 clearance、不需要出差**(这是和 Scale AI 最大的区别);
- **沟通能力要求低**(主要是 Slack / 文档协作,几乎不开会)。
Baseten 的商业模型:卖「Dedicated inference + Embedded engineering」,FDE 的工时直接被算进客户的合同金额(按月 / 按季度计费)。FDE 在 Baseten 不是成本中心,是 revenue line。
三、Sierra 派 —— 商业结果导向的「Agent Strategist」
Sierra 可能是三家里面最不像 FDE 的 FDE 团队 —— 他们的职位名称都不叫 FDE,叫 Agent Strategist。
Sierra 官方博客 Agent Strategist: Your PhD in applied AI(HTTP 200)原话:
Last year, this role barely existed. Today, it's our fastest-growing team.
Sierra 的 Agent Strategist 工作内容(基于该博客的 4 个客户案例):
1. Get to ground truth:和客户的 C-suite、客服、产品、运营、市场团队全部 stakeholder 谈一遍,找出最值得做 agent 化的 1-2 个工作流。
2. Design and build agents:把客户的真实客户旅程(订单查询、First Notice of Loss、退货授权)拆解成 SOP,画成 agent 的 decision tree,配置 agent 的 tone、行为、fallback。
3. Drive outcomes:Sierra 的定价是 outcome-based(按解决率 / 节省成本分成),Agent Strategist 的 KPI 是「CSAT 提升多少 / 解决了多少对话 / 节省了多少取消订单 / 带来多少新营收」。
4. Shape what Sierra builds:因为 Strategist 最贴近客户,他们往往是第一个发现「这个功能该加 / 该改」的人,反向推动 Sierra 的产品 roadmap。
Sierra 的 4 个真实客户案例(直接来自该博客):
- **全球旅游公司**:20+ 内部 stakeholder、零 API;Strategist 帮他们「分信号 vs 噪声、定目标、做可执行计划、推优先级、上线」。
- **头部医疗公司**:大愿景 + 模糊目标;Strategist 帮他们「**先把一个 agent 跑上线再说**」,从 1 个 use case 扩到「覆盖每个患者触点」。
- **全球硬件制造商**:紧急扩到 16+ 语言;Strategist 用了不到 2 个月搞定 edge cases(serial number 捕获、转写、发音)。
- **全球科技公司**(已脱敏):**单一 voice agent 上线后每天处理 10 万通电话,且持续增长**。
- **大型服务公司**:原计划 multi-month rollout;遇到风暴时 Strategist 帮他们**48 小时内上线第一个 agent**,处理暴增的客诉。
- **全球配送平台**:提前上线 + 持续迭代,**解决率提升约 30%**。
招聘门槛(博客原话:「It's a role that combines go-to-market, consulting, and building in one」):
- **业务 sense + 产品 sense**(能跟 CXO 聊战略);
- **技术深度**(能写 prompt、跑几百次 simulation、调 agent 的 tone);
- **手艺人精神**("This takes craftsmanship",不是流水线工人);
- **结果导向**(「increase resolution rates by ~30%」这种数字必须能 deliver);
- **不需要 ML 论文背景**(更看重「能不能把客户的客服流程拆明白」)。
Sierra 的商业模型:Sierra 在 2026 年 2 月 6 日的官方博客 Year two in review 中披露 ARR 已超 1.5 亿美元(来源:Sierra 官方博客,HTTP 200 可访问),且是 outcome-based pricing。这意味着 Agent Strategist 实际上是 Sierra 收入的核心驱动力 —— 没有他们把客户跑通,Sierra 一分钱都收不到。
三种模型的对比表
| 维度 | Scale AI FDE | Baseten FDE | Sierra Agent Strategist |
|---|---|---|---|
| 客户类型 | 政府 / 国防 / 大型机构 | AI-native 应用公司 | 大型 CX 团队(保险、医疗、旅游、零售) |
| 商业模型 | 数据 + 部署服务订阅 | 推理平台 + 工程服务费 | Outcome-based 订阅(按解决率分成) |
| 核心 KPI | 项目按时交付 / 政府满意度 | P99 latency / GPU 成本 | CSAT / 解决率 / 营收增量 |
| 驻场要求 | 100% on-site(政府客户) | 远程 + Slack 协作 | 50% 客户现场 + 50% 远程 |
| 招聘关键词 | Clearance / 数据 pipeline | CUDA / vLLM / Triton | GTM / Consulting / Building |
| 沟通对象 | 政府 PM + 军方工程师 | 客户的 ML platform 团队 | 客户 CXO + 客服主管 + 产品经理 |
| 「黑话」 | Delta role | Inference engineering | Agent Strategist |
| 典型薪资带(参考 HFS 报告行业基准) | $180-280K + clearance bonus | $200-300K(base + equity) | $160-240K(base + outcome bonus) |
三种 FDE 模型的工作流对比

关键点总结
- 🎯 **FDE 已经从 Palantir 内部行话变成全球 AI Infra 公司的标准工种**(pierpaolo28/Awesome-FDE-Roadmap 已成社区共识);
- 🏛️ **Scale AI 的 FDE 是「政府/国防派」**:要 clearance、要长期驻场,核心是「把 AI 接入 on-prem legacy 系统」;
- ⚡ **Baseten 的 FDE 是「推理工程派」**:只要性能好,核心是「**把 P99 latency 砍掉一半、把 GPU 成本砍掉一半**」;
- 🎨 **Sierra 的 Agent Strategist 是「商业结果派」**:要业务 sense + 咨询能力 + 工程师手艺,核心是「**让一个 agent 真的帮客户赚到钱或省到钱**」;
- 💰 **三家公司的 FDE 都不是「成本中心」**:Scale 算进政府合同、Baseten 算进 inference 服务费、Sierra 算进 outcome-based 订阅 —— **FDE 的工时直接转化为收入**;
- 📈 **2026 年 FDE 招聘最难的「混合体」**:HN 上 招聘者原话「can't seem to find the combo of strong coding chops + customer-facing experience」正是行业痛点 —— 三家公司实际上是用**三个独立角色**分别解决了这个难题,而不是找一个「全才」;
- 🌐 **国内可借鉴路径**:参考 Baseten 的「推理工程 FDE」最现实,参考 Sierra 的「Agent Strategist」最长期,参考 Scale AI 的「政府派」需要先有 clearance 制度;
- 🔮 **HFS Research 的预测**:FDE 是企业 AI 从「pilot」到「production」的唯一通道,未来 18 个月内不建 FDE 团队的 AI Infra 公司会被淘汰。
行业影响与未来展望
HFS Research 在那份报告中给出了一个非常尖锐的判断(原报告):
Sierra Agent Strategist 与客户的协作时序

Every quarter your enterprise spends in pilot mode is a quarter your competitors are driving production AI advantages. Demand FDE-capable delivery from your services partners, and measure them on production deployments, not roadmap slides. If a partner cannot show a working workflow in your live systems within 90 days, they are not your AI transformation partner.
翻译一下:如果一个 AI 合作伙伴 90 天内不能在客户的 live system 上跑出 production workflow,那它就不是 AI transformation partner。这就是为什么 2026 年所有 AI Infra 公司都在抢 FDE —— 因为 FDE 是把 demo 变成 ARR 的唯一「physical layer」。
对国内 AI Infra 公司(阿里通义、字节火山、月之暗面、智谱、DeepSeek 等)来说,2026 年最值得做的 3 件事是:
1. 先建一支 5-10 人的 Baseten 派 FDE(最低成本、最高 ROI),用推理性能优化打头阵;
2. 同步招 2-3 个 Sierra 派 Agent Strategist(长线布局),从「卖 token」走向「卖 outcome」;
3. 避免直接抄 Scale AI 派(国内没有 defense clearance 制度,硬抄会走形),等政府 AI 采购流程成熟后再考虑。
结语:FDE 不会消失,只会分化
FDE 不是一个 job title,它是一种商业模式的折射。Scale AI 卖「数据 + 部署」、Baseten 卖「推理」、Sierra 卖「outcome」,所以它们需要的 FDE 本质上是三种人。试图用一种 FDE 解决所有问题,正是 HN 上那位招聘者找不到人的根因。
对于正在考虑「我要不要转 FDE」的工程师来说,先问自己一个问题:你喜欢的是「和政府 PM 谈 on-prem 部署」「和 CUDA 编译器较劲」「还是和客户 CXO 聊 agent 怎么省钱」?三种 FDE 都需要 coding chops + 沟通能力,但比重完全不同。
下一次 FDE 系列第 10 篇,我们会拆解制造业/零售业的 FDE 落地方法论(Day 10 主题)—— 这些非科技行业才是 FDE 真正能复利的地方,敬请期待。
参考资料
官方文档(来源:Sierra / Baseten / Scale AI / HFS 官方域名)
- Sierra Blog: Agent Strategist: Your PhD in applied AI - 2026-05-19 — Sierra 官方对 Agent Strategist 工种的定义 + 6 个真实客户案例
- Sierra Blog: Year two in review - 2026-02-06 — Sierra 官方披露 ARR 突破 1.5 亿美元、进入 year three
- Baseten: Embedded Engineering with Inference experts - 2026 — Baseten 官方对 FDE 工种的定义(inference-specific / performance optimization)
- HFS Research: Stop treating FDE as optional - 2026-03-09 — HFS Research 2026 年 3 月发布的 FDE 行业报告
- Anthropic Careers - 持续更新 — Anthropic 官方招聘页(含 FDE / Applied AI 类岗位)
开源项目(来源:GitHub 官方 API)
- pierpaolo28/Awesome-FDE-Roadmap - 2026-06-25 更新,501 stars — 社区最权威的 FDE 学习路线图(含 Palantir / OpenAI / Scale AI 案例)
- yeasy/forward_deployed_engineering_guide - 持续更新 — 中文社区的 FDE 最佳实践指南
行业报道(来源:HN Algolia / Stratechery / 行业博客)
- Stratechery: An Interview with Sierra Founder and CEO Bret Taylor - 2025-06-26 — Ben Thompson 对 Sierra 创始人 Bret Taylor 的深度访谈
- Kai Rollmann: Forward-deployed engineer, the new full-stack frontier - 2025-11-06 — 资深工程师对 FDE 现象的批判性分析("the new 10x myth")
- HFS Research 官网 - 持续更新 — 全球企业 AI 服务研究机构
社区讨论(来源:HN Algolia 官方 API)
- HN: What's the Deal with Forward Deployed Engineers? - 2026-03-27 — 招聘者视角的 FDE 人才市场讨论
- HN: Why is the term forward deployed engineer (FDE) popular all of a sudden? - 2026-06-12 — FDE 词源 / 流行原因讨论
- HN: What's the Deal with Forward Deployed Engineers? (follow-up) - 2026-03-27 — 同主题 follow-up 帖
- Launch HN: Parachute (YC S25) – Guardrails for Clinical AI - 2025-08-19 — 临床 AI 治理公司案例(与医疗行业 FDE 落地相关)
本文由 AI 生成。内容基于公开资料整理,可能存在事实偏差,引用链接请以原始来源为准。
