谷歌杀疯了,两天四连发!刚刚,Gemini3.1实时语音免费上线

admin 2026-04-16 04:50:07 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 谷歌免费发布Gemini3.1FlashLive实时语音模型,多步工具调用准确率达90.8%,具备背景音过滤与90余种语言支持。同期SearchLive扩展至200国,耳机同传登陆iOS。谷歌在多模态与生态整合上优势显著,所有音频均含防伪造水印。用户可通过GeminiApp或AIStudio直接免费体验该模型。 综合评分: 63 文章分类: 产品介绍,软文广告,AI安全


cover_image

谷歌杀疯了,两天四连发!刚刚,Gemini 3.1 实时语音免费上线

原创

木易的AI频道 木易的AI频道

AI信息Gap

2026年3月27日 13:00 美国

在小说阅读器读本章

去阅读

谷歌继续放大招。

昨天音乐,今天语音。

刚刚,谷歌发布 Gemini 3.1 Flash Live,专为实时对话打造的语音模型。

它能听、能看,还能原地调用工具。

谷歌今天还把 Search Live 推到了全球 200 多个国家。


ComplexFuncBench Audio 测试 AI 语音模型在聊天时能不能完成多步工具调用。

比如你说「帮我查明天最早去上海的飞机,然后加到日历」,它能不能边聊边搜索、筛选、写入日历。

谷歌上一代实时语音模型 2.5 Flash Native Audio,当时 ComplexFuncBench Audio 的成绩是 71.5%。

Gemini 3.1 Flash Live 断层提升,90.8%。

谷歌 AI Studio 负责人 Logan Kilpatrick 说,「我们花了一年多,模型、基础设施、用户体验全部推倒重做。」


Gemini 3.1 Flash Live 加了一层背景音过滤。

以前你在马路边、电视响着的环境里,模型分不清噪音和人声,很可能就把电视里的人声当成你的指令。现在能分清了。

也更听话了。你给它一套系统提示词,让它当客服只聊产品问题。以前可能聊着聊着就跑偏了,现在即使话锋一转,它也能遵循原有指令。

响应更快。对话里的尴尬停顿明显减少。

而且支持 90 多种语言。


Search Live 是今天最重磅的发布之一。

这个功能从 2025 年 7 月上线到现在,一直只在美国和印度能用。今天谷歌一口气推送到全球 200 多个国家和地区。

打开谷歌 App,搜索栏下面有个 Live 图标。

点进去,直接和谷歌搜索对话。问完一个问题,它用语音回答你,你可以继续追问,就像打电话一样。

还能打开摄像头。对着一个东西问「这是什么」,它能看到你的画面,实时回答。


Google Translate 的「耳机同声传译」也终于登陆你的 iPhone。

我们之前聊过这个功能,当时只有安卓能用。那篇文章结尾我写道,「iOS 和更多地区要等明年了。」

现在,它来了。

除了 iOS 上线,「同声传译」还扩展到了法国、德国、意大利、日本、西班牙、泰国和英国。

打开 Google Translate,选择 Live translate。你的耳机直接变身为支持 70 多种语言的实时翻译。


打开 Gemini App,Gemini Live 已经换上了刚刚发布的 3.1 Flash Live

响应更快,尴尬停顿更少,能记住的对话长度翻倍了。

以前聊几轮可能就忘了之前说过什么,现在能记住更长的上下文。

AI Studio 也已经全面支持 Gemini 3.1 Flash Live,模型 ID gemini-3.1-flash-live-preview

打开 AI Studio。默认 Playground,选 Real-time 模式,开聊。

划重点,免费。


实时语音赛道,OpenAI 有 Realtime API。谷歌是 Gemini Live API。

Anthropic 到今天都没有语音模型。Claude 死磕推理和编程,语音不是优先级。

OpenAI 在打断控制上稍微领先。你打断 AI 说话的时候,它停得更干脆,马上让你接话。

谷歌更大的优势在多模态和多语言。90 种语言,加上视觉输入,搜索、地图、翻译整套自家生态都能调用。

小细节,所有 Gemini 3.1 Flash Live 生成的音频都带 SynthID 水印。你听不出来,但机器能检测到,防深度伪造。


谷歌这周杀疯了。

昨天发布 Lyria 3 Pro,AI 音乐从 30 秒升级到 3 分钟。

今天上线 Gemini 3.1 Flash Live,Search Live 推送到 200 国,耳机实时翻译登陆 iOS。

两天。四个产品。


我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。

关注「AI信息Gap」,让 AI 成为你的外挂。



免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:AI信息Gap 木易的AI频道 木易的AI频道《谷歌杀疯了,两天四连发!刚刚,Gemini 3.1 实时语音免费上线》

评论:0   参与:  0