阿里开源 Qwen3.6-35B-A3B 模型:主打高效轻量,支持多模态思考

4 月 20 日消息,4 月 19 日(昨天)晚间,千问 3.6 系列中等尺寸模型 Qwen3.6-35B-A3B 模型正式开源,仅激活 3B。

根据介绍,该模型不但轻量高效,而且在智能体编程方面表现卓越,大幅超越前代模型 Qwen3.5-35B-A3B,并可与 Qwen3.5-27B 和 Gemma4-31B 等稠密模型一较高下。

其采用混合专家(MoE)架构,总参数量 350 亿、激活仅 30 亿,在推理过程中,可实现以更低的算力消耗完成更高性能的智能输出

阿里方面称,在考察终端编程的 Terminal-Bench2.0、长程编程任务 NL2Repo、真实世界 Agent 能力评测的 QwenClawBench 等权威基准测试中,Qwen3.6-35B-A3B 的表现均明显优于前一代 Qwen3.5-35B-A3B,以及 Gemma4-26B-A4B、Gemma4-31B 等同类开源模型。

新模型还支持多模态思考与非思考模式。多模态推理方面,在 MMBench、RealWorldQA、SimpleVQA 等多项视觉语言基准测试中,新模型表现媲美 Claude-Sonnet-4.5。在空间智能方面,Qwen3.6-35B-A3B 在例如 RefCOCO、ODInW13 等考核模型对复杂图像识别能力的基准测试中,分别取得 92 和 50.8 的成绩

Qwen3.6-35B-A3B 还实现了 OpenClaw、Qwen Code、Claude Code 等主流 Agent 框架的深度兼容,能够将模型的编程能力、原生多模态能力,更好地赋予各类智能体,完成更长程、更复杂的任务,有望成为本地部署的“智能大脑”。

附模型调用 / 体验地址如下:

这东西就那样,看测试数据还行,实际用起来估计也就那么回事,别指望太多。

小白问一下,这个“激活仅30亿”是什么意思啊?是不是说运行的时候只用30亿参数,所以对显存要求没那么高?我不太确定这样理解对不对。那是不是普通的消费级显卡(比如4090)就能跑得动了?还有帖子最后那几个体验地址,哪个对新手最友好、不需要复杂配置就能试试看的?

哇,这个开源速度可以啊。昨天刚发布今天就看到了。我之前试过用Qwen2.5-7B跑本地Agent,感觉反应速度还可以但复杂任务有点吃力。看到这个35B-A3B的测评,特别是说在终端编程和长程任务上比前代强不少,还挺心动的。就等着看有没有人出详细的本地部署教程和量化版本了,毕竟总参350亿听着挺吓人,希望激活参数少真能带来明显的效率提升。另外它说兼容OpenClaw这些框架,不知道对现有的AutoGen或者LangChain项目迁移起来麻不麻烦。

35B激活3B这个参数比很有意思,实测推理质量具体怎么样还得等用户跑

对,MoE就是每次只激活一小部分,显存要求比全量低很多,消费级显卡跑得动

激活3B显存压力小,消费级卡跑得动,是友好版本

对,A3B这激活比例对本地Agent特别友好,速度比7B快一截