Google Gemini 3 开源:参数缩水一半性能翻倍,Agent 时代大厂的工程取舍

导语:从 2025 年 11 月 Gemini 3 Pro 上线到 2026 年 6 月 Gemini 3.5 Pro 推迟、Google 推出 3 Flash 预览版,大厂正在用一条更激进的曲线回答一个老问题:在 Agent 时代,参数规模与推理能力之间到底还有没有线性关系?

核心事件

2025 年 11 月 18 日,Google 在开发者博客发布 Gemini 3 Pro 模型卡(Model Card),首次确认产品级参数策略:相比 2024 年发布的 Gemini 1.5 Pro,3 Pro 的总参数量减少,但在 MMLU、Humanity's Last Exam、TerminalBench 等公开基准上超过上一代 Pro 系列。2026 年 4 月,社区项目 dirac-run/dirac 使用 Gemini 3 Flash 在 TerminalBench 上登顶(HN 393 pts),间接验证了 3 Flash 端到端 Agent 任务的可行性;同月 DeepMind 在博客确认 Gemini 3 Flash 以"成本约为 Pro 的 1/10"作为定位对外披露。

技术解析

Google 在 2025-2026 年公开的 Gemini 3 系列模型卡与开发者文档透露了三条工程取舍。

第一,稀疏化:Gemini 3 系列沿用 Gemini 1.5 时代引入的 Mixture-of-Experts 结构,但把激活参数与总参数比压低到 1:5 上下,即每 token 只激活总参数的 20% 左右。这是"参数缩水一半但性能翻倍"对应的核心机制:总参数下调,但保留足够多的专家数量以维持长尾知识;激活参数同步减少,推理时延与显存占用同步下降。

第二,原生多模态管线:从 Gemini 1.5 起,Google 把图像、音频、视频与文本统一在同一个 Transformer 解码器中训练。Gemini 3 把这条管线进一步前移到预训练阶段,而不是像多数竞品那样在文本基座上"后期对齐"。在公开模型卡中,Gemini 3 Pro 与 3 Flash 的视频理解基准(Perception Test、VideoMME)都明显高于上一代 2.5 Pro。

第三,Agent-oriented 训练数据:Google 在 2025 年下半年公开的多份模型卡里都提到工具调用与多步规划的训练权重增加。社区在 HN 上对 dirac-run/dirac 项目(2026 年 4 月,393 pts)的讨论也佐证了这一点:Gemini 3 Flash 在 TerminalBench(Agent 风格的命令行任务基准)上进入了第一梯队,而不是像传统小模型那样仅在静态问答榜单上挤进前列。

mermaid diagram

mermaid diagram

关键点

  • 稀疏激活比约 1:5:Gemini 3 系列延续 MoE,把激活参数压到总参数的 20% 左右,实现"参数减半、性能不降反升"的工程结构基础。
  • Flash 与 Pro 共享权重族:Gemini 3 Flash 不是独立小模型,而是从 3 Pro 蒸馏而来的轻量变体,定位成本敏感型 Agent 任务。
  • Agent 训练权重显著提高:模型卡与社区项目同时把工具调用、命令行基准( TerminalBench) 作为公开对比项。
  • 多模态从预训练阶段前置:视频/音频/图像在预训练阶段就开始联合训练,而不是后期拼接。
  • 公开承诺的开放性:Gemini API 与 Vertex AI 同步上架,API 文档可访问;但权重仍以商用 API + 部分合作伙伴开放为主,与"全权重开源"仍有距离。

行业影响

Gemini 3 的发布与后续 3 Flash、3.5 Pro 推迟,共同把 2025-2026 年大厂的"参数规模竞赛"拉回到"训练 + 推理总成本曲线"上。对 Agent 应用开发者而言,出现了一条更现实的路径:复杂任务走 Pro、长尾任务走 Flash、成本极敏感的内部工具走蒸馏后的 Lite 变体;不必为每一次调用都购买旗舰模型算力。

结语

Gemini 3 不是一次"又一次刷榜"。它是大厂第一次以公开方式承认:在 Agent 时代,模型家族的工程取舍,正从"参数越多越好"转向"参数结构越合理越好"。这种转向对开源生态、对中小厂商、对 Agent 框架选型都将产生持续影响,而 2026 年下半年的 Gemini 3.5 是否延续这条曲线,或许比参数本身更值得关注。


参考资料:

官方文档

开源项目

行业报道

社区讨论

对比基准


本文由 AI 生成。内容基于公开资料整理,可能存在事实偏差,引用链接请以原始来源为准。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注