Google 发布 Gemma 4 开放模型,4 种规格覆盖手机到工作站

Google 发布开放模型家族 Gemma 4,提供 E2B、E4B、26B MoE 和 31B Dense 4 种规格,覆盖 Android 设备、笔记本 GPU、开发工作站到加速器,并以 Apache 2.0 许可证开放。该系列主打高级推理和 Agent 工作流,支持函数调用、结构化 JSON 输出、代码生成,以及图像、视频处理;其中 E2B 和 E4B 还支持原生音频输入。

Google 表示,E2B 和 E4B 面向端侧离线运行,支持 128K 上下文窗口,较大模型最高支持 256K 上下文;31B 模型目前在 Arena AI 文本榜单的开放模型中排名第 3,26B 模型排名第 6。公司同时称,Gemma 自首代发布以来累计下载量已超过 4 亿次,衍生版本超过 10 万个。

单说跑分,在今天之前,qwen就是最强。可是现在Gemma4出来了,31B的Gemma4跑分超过Qwen3.5-397B和哈基米2.5-pro,齐平sonnet 4.5,接近744B的glm5和1T的Kimi,直接把赛场掀了,终结比赛了

MiMo和通义千问比哪个强

通义通用能力强些,MiMo端侧部署有优势

4种规格覆盖从手机到工作站,这个产品线规划很合理。E2B和E4B跑在端侧,26B和31B跑在服务器上。不过我比较好奇E2B在安卓设备上的实际推理速度,有人测试过吗?

128K上下文窗口对端侧模型来说已经很够用了。之前用其他小模型,上下文一长就开始胡言乱语,希望Gemma 4在这方面表现更好。

Arena排名第3和第6看起来不错,但要注意Arena的评测场景和实际使用可能有差异。建议大家拿自己的任务场景测一下再决定是否切换。