【重磅】Gemma4来了,实测手机和电脑上效果如何?

admin 2026-04-07 01:12:37 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: Google于2026年4月3日发布Gemma4开源大模型,全系采用Apache2.0协议允许商业使用。提供四款规格覆盖手机到云端场景,其中31B稠密模型在ArenaAI排行榜位列开源第三。实测显示E2B/E4B版本在手机端运行流畅,支持256K上下文、多模态和140+语言。建议开发者通过Layla(手机)或Ollama(电脑)部署,兼顾性能与隐私安全。 综合评分: 82 文章分类: AI安全,解决方案,安全工具,安全开发,其他


cover_image

【重磅】Gemma 4 来了,实测手机和电脑上效果如何?

原创

adra1n adra1n

YY的黑板报

2026年4月4日 08:06 天津

摘要:Google 深夜发布 Gemma 4,四种规格覆盖手机到工作站,Apache 2.0 完全开源,31B 性能直接干到全球开源第三。这波是真·降维打击。 在第一时间在手机上和 19 年 mac 上进行了试用,在手机上运行的比电脑上还要流畅


01 / 四颗钻石,深夜突袭

北京时间 2026 年 4 月 3 日凌晨,Google 突然发布了新一代开源大模型 Gemma 4

这次谷歌直接放出了四款不同规格的模型,覆盖了从端侧到云端的全场景:

  • E2B:20 亿参数,高效版,专为手机和边缘设备设计
  • E4B:40 亿参数,高效版,平衡性能和功耗
  • 26B A4B:260 亿混合专家(MoE)架构
  • 31B:310 亿稠密模型,主打极致推理性能

最让人惊喜的是,这次 Gemma 4 全系采用 Apache 2.0 协议,彻底放开了商业使用限制。对比上一代 Gemma 3 的自定义协议,这一步跨得相当大。

💡 划重点:Apache 2.0 = 可商用、可修改、可再分发,几乎没有任何限制。


02 / 参数不多,性能炸裂

Gemma 4 最让人震惊的不是参数规模,而是 单位参数的智能水平

在 Arena AI 排行榜上:

  • Gemma 4 31B Dense冲到了全球开源模型第三名
  • Gemma 4 26B MoE排在第六
  • 它们击败了一大堆参数量是自己 20 倍的”巨无霸”

官方数据显示,Gemma 4 带来了这些提升:

  • ✅ 256K 超长上下文,轻松整本书处理
  • ✅ 原生多模态支持,处理文本+图像(小模型还支持音频输入)
  • ✅ 支持 140+ 种语言,中文优化更好
  • ✅ 专为 Agent 工作流优化,更适合构建 AI 智能体

📊 Gemma 4 规格对比表

| 模型 | 架构 | 参数 | 适用场景 | | — | — | — | — | | E2B | Dense | 2B | 手机、嵌入式 | | E4B | Dense | 4B | 笔记本、低配工作站 | | 26B A4B | MoE | 26B | 云端推理,成本敏感 | | 31B | Dense | 31B | 专业场景,极致性能 |


03 / 端侧狂喜:手机就能跑强模型

这次谷歌重点照顾了端侧场景。Gemma 4 E2B/E4B被称为”最强手机端开源模型”。

根据社区评测,相比同尺寸其他模型,Gemma 4 在这些方面全面领先:

  1. 更长上下文:同样参数下能处理更长文本
  2. 原生语音支持:直接处理音频输入
  3. 推理能力更强:数学、逻辑题准确率更高

唯一短板是图像批量处理稍弱于 Qwen,但整体性价比已经拉满。对于想要做端侧 AI 应用的开发者来说,这基本是目前的最优解。


05 / 开源格局再次改变

Gemma 4 的发布,其实再次印证了一个趋势:开源模型正在快速追赶闭源,而且小而精的路线越来越吃香

31B 参数就能打到全球第三,干掉很多 400B 级别的模型,这本身就说明架构和训练数据的优化空间还很大。

对于开发者和创业者来说,这是好事:

  • 部署成本更低:不用买好多张 A100 也能玩得起
  • 数据更安全:完全私有化部署,数据不出门
  • 可定制性强:Apache 2.0 想怎么改就怎么改

💎 谷歌这波是直接把”单位参数性价比”拉到了一个新高度。接下来就看社区微调出多少神仙版本了。


05 / 怎么玩?

手机上怎么玩

手机选用的不是很高端的 K80,通过 Layla进行安装,若是你喜欢折腾,也可以通过 termux 安装,更加极客一些,不过为了试用,简单点。

Layla 内置了高度优化的llama.cpp内核,能够完美调用骁龙 8 Gen 3 的 CPU (Cortex-X4 超大核)

对于这个 APP,后面写个专门教程,敬请期待!

这个安装完成之后,也是可以直接点击下载模型,这个里面的是 4b,安装完成之后直接可以对话使用了,这里说下,我在飞行模式下进行的测试,可以看下效果。

电脑上怎么玩

MAC的配置是1.4 GHz 四核Intel Core i516G内存。通过 ollama运行,选取调教好的gemma-4-E4B-it运行

ollama run kwmcglon/gemma-4-E4B-it

通过 ollama 运行后,对下面截图进行分析,整体运行时长145.9 seconds,内存飙升上去,但是还是可以接受的,对于多模态的理解也是不错的。

结果如下:

而对于那些信息是需要联网的,他的回答,关注隐私的朋友,这个用起来是没有任何问题的


总结

Gemma 4 不是那种参数堆到几千亿的”暴力美学”,而是靠架构优化把”每一块钱的性能”做到极致。 Apache 2.0 协议 + 多规格覆盖 + 惊艳性能,这波谷歌是真的想把开源市场做实。接下来几个月,应该会有一大波基于 Gemma 4 的应用冒出来。

你准备升级了吗?

👇 关注我,获取更多 AI 前沿干货



免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:YY的黑板报 adra1n adra1n《【重磅】Gemma 4 来了,实测手机和电脑上效果如何?》

评论:0   参与:  0