文章总结: 谷歌I/O2026大会核心围绕模型、编程和Agent三大领域突破:Gemini3.5Flash以Flash级模型全面超越前代Pro版本,实现289tokens/秒输出速度且成本降低50%;Antigravity2.0通过93个子Agent在12小时内花费不足1000美元构建出可运行Doom的操作系统,显著压缩工程周期;SearchAgents推动搜索进入智能体时代,支持24×7后台监控与生成式UI交互。Omni视频编辑模型实现原生音视频同步生成,Spark数字管家提供跨端定时任务管理。技术即日起逐步开放应用,涵盖搜索、编程与内容创作场景。 综合评分: 92 文章分类: AI安全,安全工具,技术标准,解决方案,安全开发
三个关键词,2026谷歌 I/O大会全说透了
腾讯技术工程
2026年5月20日 15:25 广东
在小说阅读器读本章
去阅读
导语
北京时间今天凌晨 1 点,谷歌 I/O 2026 在 Shoreline 圆形剧场落幕。整场 keynote 大约 1 小时 51 分钟,涉及十几款产品、三代模型、一个新 IDE、一个新 Agent、一套新搜索范式
但如果只能记一句话,那就是皮查伊(Sundar Pichai)在演讲第 16 分钟说的那一句。
“There are three areas where I want to go deeper today to show you the progress in each: Models, coding, and agents.“
这不是日程表,这是谷歌交给 AI 下半场的答题卡。
而这三块拼图最令人振奋的地方在于:
模型:Gemini 3.5 Flash 一个 “Flash 级” 的小模型,把谷歌自己三个月前的旗舰 Gemini 3.1 Pro 在几乎所有基准上正面打穿;
编程:Antigravity 用 93 个子 Agent、12 小时、不到 1000 美元,从零造了一个能跑 Doom 的操作系统;
Agent:Search 直接进入”Search agents“时代——它不再只回答你,它开始替你做。
这一夜,AI 第一次大规模地从”对话框”走进了”日常事”。
一、模型层:3.5 Flash 把自家上一代 Pro 干翻了,Omni 让 AI 第一次会”改”视频
1. 数据先行:每分钟 190 亿 tokens,13 个产品月活破 10 亿
讲模型之前,皮查伊先甩了一组数据,定调”现在到底有多大”:
- 谷歌每月处理 tokens:从 9.7 万亿涨到 3.2 千万亿;
- 每分钟处理:190 亿 tokens;
- 全球开发者:850 万;
- 月活破 10 亿的谷歌产品:13 个,其中 5 个超 30 亿;
- AI Overviews 月活:25 亿;
- AI Mode 上线一年,月活突破 10 亿;
- Capex 投入:从 2022 年的 310 亿美元,飙到 2026 年的 1800–1900 亿美元——四年 6 倍。
这是 Gemini 3.5 出场前的全部底气。
2. Gemini 3.5 Flash:今日全量上线,把自家上一代旗舰按在地上
接下来是模型层最大一块石头——Gemini 3.5 Flash 今日全量上线。
- 今天起在所有谷歌产品和 API 中全量开放;
- 同时成为 Gemini App 与 Google Search AI Mode 的默认模型——没错,你今天打开 AI Mode 搜的每一条,背后都已经是 3.5 Flash;
- Gemini 3.5 Pro 下个月跟上。
但真正让现场倒吸一口凉气的是数字:
- 速度:输出 289 tokens/秒,比 GPT-5.5、Claude Opus 4.7 快 4 倍以上;
- 价格:比同级前沿模型便宜超过一半;
- 性能:在几乎所有基准上,与自家三个月前的旗舰 Gemini 3.1 Pro 正面对标并实现反超。
最后这一条值得停下来再读一遍——这是一个 Flash 级模型,在主要 benchmark 上全面对标自家上一代 Pro。换算到外部世界,约等于:一辆刚出厂的”经济款”,把自家三个月前的”性能旗舰”按在地上摩擦。
四组关键基准成绩:
| 基准 | 项目 | 3.5 Flash 成绩 | | — | — | — | | Terminal-Bench 2.1 | 编码能力 | 76.2% | | GDPval-AA | 真实世界 Agent 任务 | 1656 Elo | | MCP Atlas | 大规模工具使用 | 83.6% | | CharXiv Reasoning | 多模态推理 | 84.2% |
更暴力的是它对企业账单的杀伤力——皮查伊原话:大客户若把 80% 的工作切到 3.5 Flash,一年能省下超过 10 亿美元的 API 成本。
这是谷歌今晚扔在桌上的第一张牌:”我用一个 Flash 级模型,把整个前沿模型市场的均衡价格区间,向下又拉了一档。”
3. Gemini Omni:AI 第一次会”改”一段已经拍好的视频
如果说 3.5 Flash 是模型层的”性价比王炸”,那 Omni 就是模型层的”想象力天花板”。
Demis Hassabis 上台揭幕:Omni 是一个原生的视频生成与编辑模型家族,今晚发布的首款成员叫 Gemini Omni Flash,更强的 Omni Pro 不久后跟上。
它最炸的地方,不是从零生成视频——这事 Veo 早能做。
“Just like Nano Banana redefined image editing, Omni gives you a much more natural way to edit video with conversational language.”
(正如 Nano Banana 重新定义了图片编辑,Omni 让你能用对话式语言、自然地编辑视频。)
—— Demis Hassabis
真正的跨越,是它能改一段已经存在的视频,而不破坏原有人物的表演。
你拍了一段 selfie,一句 prompt + 一张参考图,它能:把背景换掉、加上特效、塞进一个新角色——而你脸上的表情、肢体语言、说话节奏,纹丝不动。
这一步是从”生成”迈向”编辑”——而这一步,正是创作者真正在意的那一步。
发布会还顺手秀了一手原生音视频同步生成:画面、配乐、音效在同一次推理里出来,不再需要三个模型接力配菜。
首发渠道:Omni Flash 今日正式上线,同时接入 Gemini App、Google Flow 和 YouTube Shorts——其中 YouTube Shorts 用户可直接免费使用。to-C 的扩散速度,谷歌这次没省力气。
顺带一提,谷歌 AI 内容防伪水印 SynthID 自上线以来,已为 1000 亿张图像和视频、6 万年时长的音频打上水印——他们清楚 Omni 这种工具会带来什么。研究显示,人类只能正确识别约 25% 的高质量深伪视频,水印这件事不再是”可选项”。
二、编程层:Antigravity 2.0——一个能跑 Doom 的操作系统
如果说模型层是地基,那今晚最让开发者血压升高的一段,全部发生在编程板块。
主讲人是 Varun Mohan——前 Codeium / Windsurf 创始人 CEO,加入谷歌后操盘 Antigravity。他给 2.0 写下的定位只有一句:
“Unabashedly agent first.“(毫不掩饰地,Agent 优先。)
1. 一组先扔出来的数据:Antigravity 内部已经”飞起来”了
光是 Antigravity 一个产品,谷歌内部处理 token 的速度——
从今年 3 月的 5000 亿/天,飙到现在的 3 万亿/天。
两个月,6 倍。 这是 Antigravity 在内部跑出来的真实加速度。
而开发者今天拿到的 Antigravity 里的 Flash,是经过专项优化的 12× 加速版——也就是 3.5 Flash 在同等任务上吞吐能再翻 12 倍。
2. Antigravity 2.0 给开发者的三件大事
- 全新独立桌面应用:抛开传统 IDE 的”编辑器+插件”思路,把 Agent 对话面板 / Agent 产物面板 / 多 Agent 编排面板 做成一等公民;
- CLI + SDK + 原生语音:接入 Gemini audio 模型,可以直接用嘴和 Antigravity 谈需求;
- Android、Firebase、AI Studio 全栈原生集成;
- 底层引擎:Gemini 3.5 Flash × Antigravity Agent Harness,自带 sub-agents、hooks、async 三大原语。
3. 王炸时刻:93 个子 Agent,12 小时,造了一个能跑 Doom 的操作系统
Varun 在台上点开了一个不可思议的实验记录——
| 指标 | 数字 | | — | — | | 子 Agent 并行数 | 93 个 | | 总耗时 | 12 小时 | | 模型请求次数 | 超 15,000 次 | | 处理 tokens | 26 亿 | | API 总成本 | 不到 1000 美元 | | 产物 | 一个能跑 Doom 的操作系统 (含调度器 / 内存管理 / 文件系统) |
用谷歌自己的话说——
“调度程序、内存管理、文件系统,每一行代码都是 Agent 写的、Agent 测的、Agent 审计的。“
现场演示更震惊:Varun 在自家 OS 里随手敲了个 sl(Linux 老 ls 输错梗),跳出一只小火车;接着试着跑 Doom——缺驱动;他随口让 Antigravity 自己去修——修好了,全场鼓掌。
一件以前需要一整支系统团队做半年的事。
Varun 给这件事下的定调,是今晚开发者圈最值得被钉在墙上的一句话:
“Multiday engineering efforts are collapsing into hours, if not minutes.“(以前要拉几天的工程任务,正在被压缩成几小时,甚至几分钟。)
Antigravity 2.0 今天起全球开放。
三、Agent 层:Spark + Search Agents,AI 走出对话框的两条路径
到模块三,皮查伊把这一年的 “agentic” 叙事钉死:
“We are firmly in our agentic Gemini era.”
(我们已经稳稳进入 agentic Gemini 时代。)
但 Agent 不是一个产品,而是两条铺设路径——
- 一条是 Gemini App 里的主控大脑 Spark;
- 一条是直接长在全球最大入口里的 Search Agents。
1. Gemini Spark:你的 24×7 数字管家
Spark 是 Gemini App 里新冒出来的彗星图标。它的定位非常直白:
“It’s your personal AI agent that helps you navigate your digital life, taking action on your behalf and under your direction. It runs on dedicated virtual machines on Google Cloud, and it is 24/7.“
翻译成人话:它是一台 7×24 小时不打烊、托管在谷歌云上的”你”。
关键设计:
- UI 是 Chat / Agent 双 Tab——Chat 还是问答,Agent 才是派活;
- 跨端:网页 / 桌面 / Android & iPhone 实时同步;接下来还会铺到 邮件 + IM;
- 能跑定时任务(”每周一 8 点把上周会议纪要整理给我”);
- 通过 MCP 协议,未来几周打通第三方工具;
- 数据视野:连接的 Google 应用 + 聊天记录 + 已登录网站 + Personal Intelligence 个人画像 + 实时位置;
- 下半年,Spark 将直接落地到 Chrome 里,成为 “agentic browser”——这就是去年传闻已久的 “Chrome Auto Browse” 叙事的真正归宿;
- 同期还会推出 Android Halo——手机上专门为 Agent 准备的”基地”。
节奏与价格:
-
本周:仅对 trusted testers 灰度;
-
下周:向美国 Google AI Ultra 订阅用户开 Beta;
-
AI Ultra 订阅同步调整:
-
新增 $100/月 入门档——这是开通 Spark Beta 的最低门槛;
-
最高档 Ultra 计划从 降到200/月;
-
此外,Gemini App 同步改版(代号 Neural Expressive),计费模式改为按算力计费。
⚠️ Spark 自带的诚实自白:Spark 是实验性产品。虽然它被设计成在敏感操作前征求许可,但它可能在未询问的情况下分享你的信息或代你完成购买。请勿依赖它做医疗、法律、财务等专业决策。
—— 这段话是谷歌自己写在产品安全说明里的。它不是免责声明,是当下所有 agentic 产品集体面对的真实风险。
2. Search 的 25 年最大改版:进入 “Search Agents” 时代
接下来上台的是 Liz Reid(谷歌搜索负责人)。她甩出今晚 Agent 板块第二组震撼数据:
- AI Mode 上线刚一年,月活突破 10 亿;
- AI Mode 查询数自上线以来每季度翻倍;
- 已升级到 Gemini 3.5——现在打开 AI Mode,你用的就是它。
然后她说出全文最值得划线的那句:
“We’re entering the era of Search agents.“
(我们正在进入”搜索智能体”的时代。)
3.三件具体的事
(1) 全新的 AI 搜索框 —— 25 年来最大的一次搜索框升级。原生支持文本 / 图像 / 文件 / 视频混合输入,AI Overviews 与 AI Mode 之间无缝切换。
(2) Information Agents(信息智能体)—— 24×7 在后台替你”盯着”
它主动监控你交代过的事:
- demo 1:监控生物科技板块”市盈率<15、正现金流、低负债"的股票,命中即推送;
- demo 2:租房——你随口讲一段需求,它持续在背后筛新房源;
- demo 3:心仪球鞋一发售即时预警。
预计的上线时间:今年夏天。
(3) Generative UI in Search —— Antigravity 直接被嵌进 Search 后端
这是今晚 Search 部分最反直觉的一段。
-
demo 1:问一个关于黑洞引力波的物理问题,Search 现场写出了一个交互式可视化 mini-app;
-
demo 2:Search 主动提议——”要不要给你做个周末家庭计划器?”它结合 Gmail / Photos / Calendar 里的家庭画像,实时排出周末两天的行程,能转发给老婆、能一键同步到全家共享日历。
预计上线时间:今年夏天免费向所有人开放。
这意味着什么? 意味着 Search 不再只是给你一个”答案页”——它给你一个为你这个问题专门生成的临时 App。
4.顺带的一颗长期变量:UCP(Universal Commerce Protocol)
Search 章节末尾,Vidhya Srinivasan 抛出了一个野心更大的东西——UCP 通用商业协议:
“UCP does for agentic commerce what HTTP did for the web: It gives agents and systems a common language.”
(UCP 之于 agentic 商业,正如 HTTP 之于 Web——它让所有 Agent 和系统说同一种语言。)
谷歌 Shopping Graph 已收录 600 亿条商品,这是 UCP 一上来就能撑住的底盘。这一步如果跑成,”AI 替你购物”就不再是各家厂商各自的小作坊,而是整个互联网商业层的协议级重构。
四、把三块拼图咬合起来看:谷歌究竟在赌什么?
把今晚的三块板块叠在一起,会浮出一句异常清晰的判断:
AI 第一次大规模地,从”对话框”走进了”日常事”。
- 模型 → Omni 让 AI 第一次能改一段已经拍好的视频;
- 编程 → Antigravity 用 1000 美元造了一个能跑 Doom 的操作系统;
- Agent → Spark 24×7 替你跑后台,Search 边搜索边替你下单。
OpenAI 的 Agent 平台、Anthropic 的 Conway、微软的 Agent 365 都在路上。但谷歌今晚交出的这份答卷,差异化只有一句话——
“我把 Agent 直接装进了你每天必开的搜索框和 Gemini App。”
这场 Agent 决赛的胜负手,可能不在谁的模型 benchmark 高一两个点。
它在——谁能把 AI 真的铺到 10 亿人的日常里。
谷歌握着三个一般人一抬手就会用到的入口:Gemini App(Spark)+ Google Search(Search Agents)+ Antigravity(开发者)——这是一道别家短期内复制不出来的分发护城河。
至于另一面:当一个 24×7 的 Agent 拥有你的邮箱、相册、日历、位置和支付权限时,安全边界谁来守?谁来负责?——这是谷歌今晚没能给出完整答案的题,也是接下来一年所有大厂都绕不开的题。
五、写在最后
回头看皮查伊那句开场白——”Models, coding, and agents.“——它其实不是日程表,是谷歌交给 AI 时代下半场的答案:
- 模型继续往前推(更便宜、更多模态、能编辑而不只是生成);
- 编程被 Agent 重写(一个人 + 一群子智能体 = 一个工程团队);
- Agent 借着搜索框和 App 入口,第一次真正走进了 10 亿人的日常。
AI 不再只回答你,它开始替你做。
你最期待哪一件事先发生在自己身上?——
- ☐ Spark 替你管收件箱和日程
- ☐ Search Agent 替你抢球鞋 / 监控租房 / 盯股票
- ☐ Antigravity 替你写下一个项目的代码
评论区聊聊。
一分钟视频速览
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:腾讯技术工程 《三个关键词,2026谷歌 I/O大会全说透了》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。









评论