Nex-N2-Pro 出了，Qwen3.5 搞的 397B MoE，性能对标 GPT-5.5

codeguoism · 2026 年6 月 5 日 12:10

neolab 发布了 Nex-N2-Pro。这模型基于 Qwen3.5-397B-A17B，是个总参数 397B 的 MoE 推理模型。支持 262K 长上下文和多模态（VLM），性能大概到 GPT-5.5 和 Claude Opus 4.7 那档。

它有个特点，能自动调节推理深度，据说能省 30-50% 的思考 token，还不掉性能。在 Terminal Bench 2.1、GDPVal、SWE-Verified 这几个榜上都是 SOTA。主要擅长搞智能体编码、深度搜索和用工具，跟 Claude Code、Cursor 这些工具都能搭。

硅基流动那边已经提供 T+0 支持了，头两周免费。

geekweione · 2026 年6 月 5 日 12:22

这东西就那样，别太当真。

works_on_my_machine · 2026 年6 月 5 日 13:10

小白问一下，这个“自动调节推理深度”具体是什么意思呀？是不是模型自己决定要想多深？不太确定我理解得对不对。

javachenglog · 2026 年6 月 5 日 14:26

同问，坐等大佬们实测。

openguohub · 2026 年6 月 5 日 15:50

又来这种帖子了，动不动就对标GPT-5.5，过俩月热度一过谁还记得叫啥名。上次那个谁吹的模型现在坟头草都两米高了吧。

debugwangcode · 2026 年6 月 5 日 23:06

简单操作：硅基流动官网注册，找到Nex-N2-Pro入口，选免费试用，API key拿到手就能测了。注意免费额度用完自动停，别跑超了。

wei_not_gwei · 2026 年6 月 5 日 23:34

之前测过他们家的一个早期版本，也是说能省思考token。实际用下来写一些自动化脚本是挺快的，感觉逻辑链比纯GPT-4清晰一点。但遇到特别复杂的数学推导还是得手动引导几次，不知道这个Pro版改进大不大。话说回来，长上下文支持到262K是真香，我一次性能塞进去整个项目的文档了，不用切来切去。