MiniMax发布旗舰模型M3:编码与智能体能力达到国际前沿

MiniMax发布旗舰大语言模型M3,官方称其为首个同时具备编码SOTA、百万token上下文窗口和原生多模态三项能力的国产模型。在智能体评测基准BrowseComp中,M3以83.5分超过Anthropic的Opus 4.7(79.3分)。

M3基于自研的MiniMax Sparse Attention(MSA)架构,API最高支持1M token的上下文窗口,可用长度至少为51.2万token。多模态能力方面,MiniMax称M3从预训练第零步即开始联合训练文本与视觉数据,预训练数据规模扩充至百TB量级,使视觉理解成为模型的原生能力而非后期附加模块。

MiniMax在发布页面展示了M3的多项实际任务表现:模型在无人干预下用约12小时自主复现了一篇ICLR 2025杰出论文的核心实验,产出18次代码提交与23张实验图表;在CUDA算子优化任务中,M3经过147次迭代将FP8矩阵乘的硬件峰值利用率从7.6%提升至71.3%,实现9.4倍加速。在PostTrainBench评测中,M3得分37.1,排名第三,位于Opus 4.7和GPT-5.5之后。

M3目前已通过API开放使用,提供标准版与高速版(M3-highspeed)两个接口。MiniMax同时宣布,M3即将在HuggingFace和GitHub上完成开源,支持私有集群部署与微调

官方博客:

https://minimaxi.com/models/text/m3

下面来简单测测实战效果

Minimax在龙虾上表现不错

我去为什么能think那么久,思维链里都写好了代码了,就是不输出结果

M3天气卡

接不住何意味

仍然在思考投石机,思维链里又又写了吧遍,何意味啊

比自己进步大就是好的

毕竟gemini和claude上梁在前,负升级

负升级倒不至于,国产能做到这水平已经挺能打了

国产能到这水平已经挺能打了,负升级谈不上

负升级倒不至于,能追到这水平国产已经挺猛了

负升级笑死,思维链写一堆就是不出结果

国产能到这水平确实可以了,别老拿顶配来比

龙虾上确实能打,就是输出有点墨迹,思维链写半天不出货

思维链里代码都写完了就是不吐结果,这毛病有点逗