蚂蚁百灵万亿旗舰模型 Ling-2.6-1T 发布:主打“快思考”,对标 GPT-5.4 非推理版

4 月 24 日消息,蚂蚁集团旗下百灵大模型团队正式发布面向即时任务执行的万亿级综合旗舰模型 ——Ling-2.6-1T。

Ling-2.6-1T 采用了 MLA(Multi-head Latent Attention)与 LinearAttention 的混合架构设计,核心思路是摒弃行业内普遍追求的“慢思考”多步推理模式,转而以“快思考”机制实现高效推断,仅凭极低的 Token 开销直达结果,从而显著压缩输出成本和推理延迟。

这一技术路线在万亿参数量级的大模型中较为罕见,也标志着蚂蚁百灵在模型效率与智能能力之间寻求了一种新的平衡。

据官方介绍,此前的旗舰模型 Ling-1T 便已在受限输出 Token 条件下于多项复杂推理榜单上达到 SOTA 水平,而 Ling-2.6-1T 则在此基础上进一步强化了效率维度的突破。

在性能表现方面,Ling-2.6-1T 的能力提升相比早期旗舰 Ling-1T 实现了全方位的跃迁。根Artificial Analysis 的评测数据,其综合智能水平已与 GPT-5.4(非推理模式)处于同一档次。

在具体基准测试中,该模型在高难度推理任务 AIME2026 上显著领先于其他非思考型模型,展现出强劲的瞬时复杂问题求解能力。

在 Agent 执行能力方面,Ling-2.6-1T 在 SWE‑bench Verified、TAU2‑Bench、BFCL‑V4 等多个主流榜单中位居前列,无论是从代码生成到缺陷修复的完整工程流,还是复杂 API 协同调用,均能稳定胜任。

此外,该模型支持 256K 超长上下文,并在指令遵循测试 IFBench 中表现优异,可确保在多重约束条件下的执行准确率与逻辑一致性。

Ling-2.6-1T 目前已在上线之初同步提供 API 服务,开发者可通过官方平台或 OpenRouter 直接调用,Ling-2.6-1T 与当前主流 Agent 框架保持高度兼容,适用于需要稳定执行的复杂场景。

注:百灵团队还透露该模型将于近期正式开源,届时开发者可进一步基于其进行本地部署与二次开发。

随着 Ling-2.6-1T 的发布,蚂蚁百灵的模型产品矩阵进一步清晰。除该款万亿级非推理旗舰模型外,其 Ling 系列还包含 Ling‑Lite、Ling‑Plus 等不同规模版本,并与 Ring 系列长思考模型、Ming 系列多模态模型协同布局,覆盖从轻量部署到综合旗舰的多层次需求。

蚂蚁集团宣布,为方便开发者快速体验,现已在 OpenRouter 与官方平台同步提供一周免费 API 调用。

相关阅读:

  • 《蚂蚁集团百灵大模型 Ling-2.6-flash 发布,匿名上线一周日均 tokens 调用达 100B 级》

这图做的还挺好看,就是不知道实际效果有没有吹的这么神,毕竟现在大模型都卷疯了。

MLA加LinearAttention混合架构,有谁试过具体实现吗?想了解一下这种混合架构在训练时的梯度处理细节有没有什么特别的门槛?

东西挺多,先mark一下,回头空了细看。

快思考这个概念其实挺有意思的,之前玩过一些需要快速响应的Agent应用,等推成那种多步思考的确实急死人。如果这个模型真能又快又准,那很多实时交互场景就有搞头了。不知道开源版本什么时候放出来,想自己部署试试水。

哎哟,又来个对标GPT的,上一个这么说的现在坟头草都三米高了吧?

小白问一下,这个“非推理版”是啥意思啊?是说它不擅长一步一步想问题吗?那和普通的大模型有啥区别?

没用过别碰。

之前做项目用过百灵家的其他模型,接入流程倒是挺顺的。这个新模型上线的话,估计API调用方式也大差不差,先去官方文档找接入点,申请个key,然后照着SDK示例改参数就行。注意下输入输出的格式要求。

早上刚在推特上看到有人转了这条新闻,下午论坛就有了,速度真快。话说回来,最近国产模型发得是真的密,感觉每周都有新东西看,都跟不过来了。我比较关心它那个256K上下文,处理长文档到底稳不稳,别中间丢信息。

我家猫刚踩过键盘,打了一串乱码。不过这个模型能处理吗?哈哈,开个玩笑。说正经的,主打低延迟对做应用的是好事,但就怕为了快牺牲了准确性,等一波实测。

万亿参数听着唬人,普通用户根本接触不到这种规模

万亿参数不光是堆规模,关键看推理速度能不能扛住,国内这块还差点

MLA加Linear这种混合一般在reset gate和kv cache分配上要做手脚,不然梯度回传容易爆

万亿参数对普通用户没啥可玩的

非推理版就是一步出答案,不会先想再答,速度快但复杂题容易翻车

MLA加LinearAttention混合架构训练稳定性是难点,需要梯度裁剪策略

MLA加Linear混合在kv cache分配确实要做手脚