2026-04-07 01:12:37 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： Google于2026年4月3日发布Gemma4开源大模型，全系采用Apache2.0协议允许商业使用。提供四款规格覆盖手机到云端场景，其中31B稠密模型在ArenaAI排行榜位列开源第三。实测显示E2B/E4B版本在手机端运行流畅，支持256K上下文、多模态和140+语言。建议开发者通过Layla（手机）或Ollama（电脑）部署，兼顾性能与隐私安全。 综合评分： 82 文章分类： AI安全,解决方案,安全工具,安全开发,其他

cover_image

【重磅】Gemma 4 来了，实测手机和电脑上效果如何？

原创

adra1n adra1n

YY的黑板报

2026年4月4日 08:06 天津

摘要：Google 深夜发布 Gemma 4，四种规格覆盖手机到工作站，Apache 2.0 完全开源，31B 性能直接干到全球开源第三。这波是真·降维打击。在第一时间在手机上和 19 年 mac 上进行了试用，在手机上运行的比电脑上还要流畅

01 / 四颗钻石，深夜突袭

北京时间 2026 年 4 月 3 日凌晨，Google 突然发布了新一代开源大模型 Gemma 4。

这次谷歌直接放出了四款不同规格的模型，覆盖了从端侧到云端的全场景：

E2B：20 亿参数，高效版，专为手机和边缘设备设计
E4B：40 亿参数，高效版，平衡性能和功耗
26B A4B：260 亿混合专家（MoE）架构
31B：310 亿稠密模型，主打极致推理性能

最让人惊喜的是，这次 Gemma 4 全系采用 Apache 2.0 协议，彻底放开了商业使用限制。对比上一代 Gemma 3 的自定义协议，这一步跨得相当大。

💡 划重点：Apache 2.0 = 可商用、可修改、可再分发，几乎没有任何限制。

02 / 参数不多，性能炸裂

Gemma 4 最让人震惊的不是参数规模，而是 单位参数的智能水平。

在 Arena AI 排行榜上：

Gemma 4 31B Dense冲到了全球开源模型第三名
Gemma 4 26B MoE排在第六
它们击败了一大堆参数量是自己 20 倍的”巨无霸”

官方数据显示，Gemma 4 带来了这些提升：

✅ 256K 超长上下文，轻松整本书处理
✅ 原生多模态支持，处理文本+图像（小模型还支持音频输入）
✅ 支持 140+ 种语言，中文优化更好
✅ 专为 Agent 工作流优化，更适合构建 AI 智能体

📊 Gemma 4 规格对比表

| 模型 | 架构 | 参数 | 适用场景 | | — | — | — | — | | E2B | Dense | 2B | 手机、嵌入式 | | E4B | Dense | 4B | 笔记本、低配工作站 | | 26B A4B | MoE | 26B | 云端推理，成本敏感 | | 31B | Dense | 31B | 专业场景，极致性能 |

03 / 端侧狂喜：手机就能跑强模型

这次谷歌重点照顾了端侧场景。Gemma 4 E2B/E4B被称为”最强手机端开源模型”。

根据社区评测，相比同尺寸其他模型，Gemma 4 在这些方面全面领先：

更长上下文：同样参数下能处理更长文本
原生语音支持：直接处理音频输入
推理能力更强：数学、逻辑题准确率更高

唯一短板是图像批量处理稍弱于 Qwen，但整体性价比已经拉满。对于想要做端侧 AI 应用的开发者来说，这基本是目前的最优解。

05 / 开源格局再次改变

Gemma 4 的发布，其实再次印证了一个趋势：开源模型正在快速追赶闭源，而且小而精的路线越来越吃香。

31B 参数就能打到全球第三，干掉很多 400B 级别的模型，这本身就说明架构和训练数据的优化空间还很大。

对于开发者和创业者来说，这是好事：

部署成本更低：不用买好多张 A100 也能玩得起
数据更安全：完全私有化部署，数据不出门
可定制性强：Apache 2.0 想怎么改就怎么改

💎 谷歌这波是直接把”单位参数性价比”拉到了一个新高度。接下来就看社区微调出多少神仙版本了。

05 / 怎么玩？

手机上怎么玩

手机选用的不是很高端的 K80，通过 Layla进行安装，若是你喜欢折腾，也可以通过 termux 安装，更加极客一些，不过为了试用，简单点。

Layla 内置了高度优化的llama.cpp内核，能够完美调用骁龙 8 Gen 3 的 CPU (Cortex-X4 超大核)

对于这个 APP，后面写个专门教程，敬请期待！

这个安装完成之后，也是可以直接点击下载模型，这个里面的是 4b，安装完成之后直接可以对话使用了，这里说下，我在飞行模式下进行的测试，可以看下效果。

电脑上怎么玩

MAC的配置是1.4 GHz 四核Intel Core i5加16G内存。通过 ollama运行，选取调教好的gemma-4-E4B-it运行

ollama run kwmcglon/gemma-4-E4B-it

通过 ollama 运行后，对下面截图进行分析，整体运行时长145.9 seconds，内存飙升上去，但是还是可以接受的，对于多模态的理解也是不错的。

结果如下：

而对于那些信息是需要联网的，他的回答，关注隐私的朋友，这个用起来是没有任何问题的

总结

Gemma 4 不是那种参数堆到几千亿的”暴力美学”，而是靠架构优化把”每一块钱的性能”做到极致。 Apache 2.0 协议 + 多规格覆盖 + 惊艳性能，这波谷歌是真的想把开源市场做实。接下来几个月，应该会有一大波基于 Gemma 4 的应用冒出来。

你准备升级了吗？

👇 关注我，获取更多 AI 前沿干货

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：YY的黑板报 adra1n adra1n《【重磅】Gemma 4 来了，实测手机和电脑上效果如何？》