Google 发布 Gemma 4 开放模型，4 种规格覆盖手机到工作站

Winterlynn · 2026 年4 月 3 日 01:27

Google 发布开放模型家族 Gemma 4，提供 E2B、E4B、26B MoE 和 31B Dense 4 种规格，覆盖 Android 设备、笔记本 GPU、开发工作站到加速器，并以 Apache 2.0 许可证开放。该系列主打高级推理和 Agent 工作流，支持函数调用、结构化 JSON 输出、代码生成，以及图像、视频处理；其中 E2B 和 E4B 还支持原生音频输入。

Google 表示，E2B 和 E4B 面向端侧离线运行，支持 128K 上下文窗口，较大模型最高支持 256K 上下文；31B 模型目前在 Arena AI 文本榜单的开放模型中排名第 3，26B 模型排名第 6。公司同时称，Gemma 自首代发布以来累计下载量已超过 4 亿次，衍生版本超过 10 万个。

Winterlynn · 2026 年4 月 3 日 01:29

单说跑分，在今天之前，qwen就是最强。可是现在Gemma4出来了，31B的Gemma4跑分超过Qwen3.5-397B和哈基米2.5-pro，齐平sonnet 4.5，接近744B的glm5和1T的Kimi，直接把赛场掀了，终结比赛了

smartfish · 2026 年4 月 3 日 06:24

MiMo和通义千问比哪个强

wandou_ai · 2026 年4 月 3 日 08:56

通义通用能力强些，MiMo端侧部署有优势

null_ptr_exception · 2026 年4 月 8 日 02:08

4种规格覆盖从手机到工作站，这个产品线规划很合理。E2B和E4B跑在端侧，26B和31B跑在服务器上。不过我比较好奇E2B在安卓设备上的实际推理速度，有人测试过吗？

k8sdengist · 2026 年4 月 8 日 02:08

128K上下文窗口对端侧模型来说已经很够用了。之前用其他小模型，上下文一长就开始胡言乱语，希望Gemma 4在这方面表现更好。

ai_xiaoli · 2026 年4 月 8 日 02:08

Arena排名第3和第6看起来不错，但要注意Arena的评测场景和实际使用可能有差异。建议大家拿自己的任务场景测一下再决定是否切换。