前端铺开智能体,后端猛砸TPU:直击谷歌I/O大会_IT产业网_IT科技门户
首页 > 资讯 > 评论

前端铺开智能体,后端猛砸TPU:直击谷歌I/O大会

2026/05/20 11:57      光锥智能


  泄洪式更新,谷歌如何布局芯片、模型和智能体?

  文|魏琳华

  曾经号称“看不懂AI”的伯克希尔,开始加仓AI。

  谷歌,就成了Q1伯克希尔大量加持的其中一家AI公司。一季度,伯克希尔增持谷歌母公司Alphabet的A类股3640万股,环比激增约204%,持仓市值增至156亿美元。

  投资公司们的热钱开始翻倍投入谷歌的同时,谷歌也用真实数据展示了一件事——当AI真正开始为普通人所用时,它的增长曲线能飞得多漂亮。

  “两年前,我们每月处理的总计9.7 万亿个Tokens,去年在I/O大会上,这一数字已增长至约480 万亿;如今,这一数字更是激增了7倍,达到每月3200万亿的水平。”在北京时间5月20日凌晨1点开启的谷歌I/O大会上,谷歌CEO桑达尔·皮查伊说。

  紧接着,他放出了一组组翻倍的用户数量和Token消耗数据:谷歌的模型API现在每分钟处理大约190亿个Tokens,环比上季度增长6倍;Gemini App月活超过9亿,同比去年4亿翻了一倍,用户每日请求总量则翻了7倍。

  Token消耗量一日千里的情况下,谷歌开始用密集的新品轰炸,抓住当前最能撑起Tokens生意的产品——智能体。

  本届I/O大会上,谷歌的信念是“万物皆可智能体”:

  要个人助手,有7×24在线、对标龙虾的云端智能体Gemini Spark;

  要Vibe Coding,有支持多个Agent同时运行的Antigravity 2.0版本;

  要搜索体验,有能帮用户准确查找信息的多个智能体协同;

  Gemini App更是针对用户需求在各个维度增设了各类Agent。

  用模型当技术底气,用应用带动Tokens消耗翻倍的同时,谷歌对AI基础设施的投入也随之翻倍。

  去年,谷歌云在AI基础设施上投入了超过300亿美元。皮查伊在大会上表示,今年这一数字将是去年的六倍左右,大约为1800亿至1900亿美元。

  砸钱做基建,是为了每月都在翻倍的消耗做准备,但谷歌的野心不局限在谷歌云。据外媒报道,谷歌和黑石集团将共同创建一家新AI云公司,以谷歌的TPU芯片为核心,这可能代表着谷歌正在挑战英伟达等芯片公司的地位。

  作为少有布局芯片-模型-产品的公司,谷歌在本届I/O大会上已经铺开了一张巨大的地图。

  视频模型、文本模型双发布 打问号的性价比

  本届I/O大会上,模型和智能体成为了最有看点的发布内容。

  一向喜欢在I/O大会先展示AI模型的谷歌,今年也不例外,拿出了两款模型——多模态模型Gemini Omni Flash(下简称Omni)和又快又便宜的Gemini 3.5 Flash。

  作为单开新系列的模型,Omni支持从任何输入创建任何内容,它现在支持用户输入文本、图片、文件、视频给到模型,目前只支持输出视频,后续会扩展到文本、音频等内容形态。

  通过同时训练不同形态的数据,Omni在物理规律的理解上表现有所提升。光锥智能测试让Gemini Omni Flash生成一个“台球白球击打红球入袋”的视频,相比上一代Veo的表现,Omni对力学的理解确实有进步,白球在击飞红球后实现了缓慢静止的要求,改掉了Veo版本击打后仍然乱飞的效果。

  提示词:一个专业的台球厅特写镜头。光滑的绿色台呢桌面上,一颗光泽的白色母球正朝一颗静止的红色球匀速直线滚动。在碰撞的瞬间,给予一个慢动作特写:白球精确地击中红球中心,自身所有动能传递,慢慢停止,而被击中的红球则沿着一条笔直的轨迹,快速滚向角落的球袋,干净利落地落入袋中,发出清脆的落袋声。整个过程符合经典牛顿力学,光线柔和,画面具有真实感和物理质感。

  Omni也吸取了图片编辑模型Nano Banana的爆火思路,被训练成一个支持靠文本描述修改的视频编辑模型。现场展示中,谷歌展示了“让雕塑变成泡泡”、“根据图片上画出的动线,让鱼顺方向游动”等案例。

  前几天被曝光的Gemini 3.5 Flash模型,也如预料般成为了I/O大会的展示主力。

  谷歌眼中的新模型,主打一个“又快又便宜”,在模型部分性能(如Agentic能力、多模态等)超越Gemini 3.1 Pro的同时,有点给各类智能体打基础的意思。

  在每秒Token输出速度上,Gemini 3.5 Flash比海外部分前沿模型快4倍,测试效果非常直观,让它写个简单游戏代码几乎是“喷”出来一般的快。皮查伊现场还表示,搭载上自家的编程产品Antigravity,整体速度能快12倍。

  诚然,从绝对性能角度来说,Flash模型没办法跟其它家最新旗舰模型打擂台,但用谷歌的话说,它的成本是前沿模型的一半。

  这里我们以Claude Sonnet 4.6为例,以其每百万Token输入3美元、输出15美元的价格对比,后者每百万输入为1.5美元(50%)、输出9美元(66.7%)的价格优势显著。

  皮查伊当场算了笔账,表示许多公司年度Token预算超过1万亿,若将负载迁移到Gemini 3.5 Flash,每年可省10亿美元。

  虽然谷歌对自己的新模型大加赞赏,但对于关注谷歌Flash系列定价的用户来说,Gemini 3.5 Flash再好,它的价格定位也超出了Flash系列的“便宜”预期。

  比起前一代Gemini 3 Flash每百万Token输入0.5美元、输出3美元的定价相比,新的Flash模型相当于定价直接翻了三倍。何况现在据AA排行榜上显示,Gemini 3.5 Flash的综合分数低于Gemini 3.1 Pro,从上面的跑分也能看到,其实在HLM(人类最后测试,反映模型处理复杂任务能力)部分指标上表现不如后者,这让新模型处在一个“比起旗舰不香、比定价又翻倍”的尴尬境地。

  为了测试它和Gemini 3.1 Pro到底谁编程更香,光锥智能做了个测试,让两个模型分别做个简单的魔塔小游戏出来,两版代码都在运行的时候出现了地图部分线路堵死导致无法游玩的问题。但要求它们修改的时候,Gemini 3.1 Pro直接修复了地图路线规划问题,但Flash版本对话修改失败。谷歌给出的“性能全面超越”,可能需要打个问号。

  除了对模型能力的优化,谷歌也试图通过可视化进一步提升用户体验。比如我们在测试Gemini 3.5 Flash的时候,Gemini会选择性把一部分对话用AI编程的方式,做可视化的效果呈现。不过在测试中,等了超过5分钟也没等到最终效果生成,等待时间拉长,体验感反倒降低了。

  至于新款旗舰模型到底表现如何,答案还要在下个月Gemini 3.5 Pro的发布上见分晓。

  全线上新智能体 谷歌的AI订阅生意

  “我们已经进入了新的智能体时代。”谷歌产品经理的一句开场白后,本届I/O大会的绝对主角——智能体占据了大多数时间的展示。

  比起只发布Flash版本给大伙尝鲜的两个模型,谷歌的重头戏还是放在了智能体上。一场大会里,基本每个介绍单元都有Agent的出现。这些产品的底层模型,也正是上文发布的Gemini Flash 3.5。

  说实话,在Claude有Cowork,国内也纷纷跟进智能体的情况下,Google来得不算早。但坐拥一系列产品,如何把智能体放进各个产品中,谷歌确实也需要更多时间考虑这个问题。

  最直接对标龙虾的Agent是Gemini Spark,这是一个运行在谷歌云上的云端智能体。

  可以说,谷歌做这种面向大众消费者的思路也一样谨慎,在安全的前提上做尝试。比如在联动谷歌产品时,默认关闭状态,用户可以选择手动开启。

  Spark目前看下来,它的杀手锏是与 Gmail、日历、驱动器、文档、表格、幻灯片、YouTube 、地图等谷歌产品无缝打通,通过自家庞大的应用生态,做到能够接近龙虾式的高权限优势。

  在谷歌的现场展示中,Spark能帮忙起草电子邮件、抓取表格信息并整理到文档中、根据抓取的内容做好日程提醒,可以说桩桩件件都和谷歌生态强相关。上述功能演示看起来比较简单和初级,也印证了谷歌本身还在智能体赛道试水的情况。谷歌还表示,前期先打通内部能力,后几周将会更新MCP加入第三方功能联动。

  不过,目前我们还无法直接体验到Spark产品。谷歌披露,本周开始,Gemini Spark将面向少数用户开放,后续将面向Google AI Ultra用户和部分企业用户开放。它即将出现在邮件、Gemini App中,今年夏天还可能出现在浏览器里。

  放在谷歌王牌的AI搜索转型上,智能体能力的加入,也成了AI搜索优化的看点。

  它支持开启多个智能体帮助用户搜索信息,比如做一个特定金融领域收集股票信息的Agent、让AI帮你做租房信息更新的实时追踪。这个服务将在今年夏天向AI Pro和Ultra订阅用户开放。

  智能体编程能力也被整合进了AI搜索。

  用户可以直接借助搜索结果构建可视化效果。比如,在用户搜索一些复杂名词时,AI能够直接做出可视化的动画,相当于直接做了个动画版本的演示,让用户不仅能通过文字了解,更能上手体验。这是一项免费服务,预计今年夏天对用户开放。

  在购物方面,谷歌引入的智能体更多是作为体验优化和支付生态标准。

  以Universal Cart(通用购物车)为例,它不仅能提供价格比较和优惠信息,还能进行跨平台比价、给出用户购物建议。一个让笔者印象深刻的例子是,当用户想要组装一台电脑时,购物车功能可以主动发现硬件兼容性问题——比如CPU与主板不匹配、电源功率不足,从而给用户提供购物指导。

  在Gemini产品的优化中,一些特定功能的智能体成了拉升用户体验的附赠品。

  比如帮你整理每日讯息、待办事项的Daily Brief;Google Flow中的多模态创作智能体则支持同时进行多个创作任务,比如针对一张图片同时生成16个不同角度的拍摄效果视频。

  大张旗鼓做智能体,谷歌想在C端靠智能体能力的加入,丰富付费服务的同时,让更多用户选择为智能体买单。

  会议上,谷歌宣布为AI订阅的Ultra档服务开放一个每月100美元的新档,上述介绍的智能体能力就能够在这个更低定价的服务中开放。此外,谷歌的AI编程产品Antigravity也迎来升级,开放多智能体任务的同时,也将打通到AI Ultra的订阅中。

  在OpenAI最近宣布把最高档订阅价格砍半、由每月200美元降低至100美元后,谷歌的动作也来了。在大会上,谷歌也宣布,将每月250美元的订阅价格降低50美元。

  谷歌的智能体轰炸和定价调整,放在C端来看,都是在为竞争加剧的订阅生意做准备。

  AI基建投入翻6倍 谷歌AI生态闭环

  两款模型发布、一系列智能体的更新好比繁花,而它们扎根的土壤——AI基建,虽然只是被简单提及,但它正在成为谷歌讲通物理AI故事、拉升公司市值的关键业务。

  谷歌对AI基建的投入狂热,从真金白银上直接体现出来。比去年翻了6倍、高达180亿美元以上的投入,虽然谷歌有钱,但这对它来说依然是一笔不小的投入。

  “我们一直在为现在和未来投资。”皮查伊说。

  两款之前已经在谷歌云大会上发布的第八代芯片8t和8i,分别对应大模型的训练和推理,前者让每单元的计算性能提升3倍,通过全球100万+分散各地的芯片共同调用,它们让谷歌的模型训练速度“从几天变为几周”,后者则提升了模型的推理速度——在现场展示中,Gemini的Flash模型每秒钟输出Token速度提升到了接近1500个左右。

  利好自家的同时,谷歌的TPU也正在成为硅谷各家AI大厂争相囤货的对象之一。

  先是今年2月,Meta叫停自家自研芯片业务的同时,展开与AMD、谷歌合作,据The Information报道,Meta和谷歌达成一项关于租赁TPU的数十亿美元交易,同时Meta在洽谈明年购买TPU业务;Anthropic也和谷歌、博通签署长期协议,承诺在未来五年内采购约5吉瓦的TPU算力用于模型训练。

  搭建起庞大的芯片销售业务之外,借助TPU,谷歌的AI云业务还在进一步拓展。

  5月,黑石集团也被曝与谷歌达成合作,向一家合资企业投资50亿美元,其中黑石提供50亿美元,谷歌提供包括TPU专用芯片在内的软硬件服务,新公司计划在2027年实现500兆瓦算力。

  至此,谷歌的芯片-云服务-模型-产品生态已经愈发完整,随着AI带动Token消耗量指数级增长,每一层业务的提升,都能让谷歌在AI领域再拿出一笔漂亮的营收。

IT产业网微信二维码logo

  榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。

海报生成中...

分享到微博

扫描二维码分享到微信

分享到微信
一键复制
标题链接已成功复制

最新新闻

热门新闻