neolab 发布了 Nex-N2-Pro。这模型基于 Qwen3.5-397B-A17B,是个总参数 397B 的 MoE 推理模型。支持 262K 长上下文和多模态(VLM),性能大概到 GPT-5.5 和 Claude Opus 4.7 那档。
它有个特点,能自动调节推理深度,据说能省 30-50% 的思考 token,还不掉性能。在 Terminal Bench 2.1、GDPVal、SWE-Verified 这几个榜上都是 SOTA。主要擅长搞智能体编码、深度搜索和用工具,跟 Claude Code、Cursor 这些工具都能搭。
硅基流动那边已经提供 T+0 支持了,头两周免费。
小白问一下,这个“自动调节推理深度”具体是什么意思呀?是不是模型自己决定要想多深?不太确定我理解得对不对。
又来这种帖子了,动不动就对标GPT-5.5,过俩月热度一过谁还记得叫啥名。上次那个谁吹的模型现在坟头草都两米高了吧。
简单操作:硅基流动官网注册,找到Nex-N2-Pro入口,选免费试用,API key拿到手就能测了。注意免费额度用完自动停,别跑超了。
之前测过他们家的一个早期版本,也是说能省思考token。实际用下来写一些自动化脚本是挺快的,感觉逻辑链比纯GPT-4清晰一点。但遇到特别复杂的数学推导还是得手动引导几次,不知道这个Pro版改进大不大。话说回来,长上下文支持到262K是真香,我一次性能塞进去整个项目的文档了,不用切来切去。