MiniMax发布旗舰大语言模型M3,官方称其为首个同时具备编码SOTA、百万token上下文窗口和原生多模态三项能力的国产模型。在智能体评测基准BrowseComp中,M3以83.5分超过Anthropic的Opus 4.7(79.3分)。
M3基于自研的MiniMax Sparse Attention(MSA)架构,API最高支持1M token的上下文窗口,可用长度至少为51.2万token。多模态能力方面,MiniMax称M3从预训练第零步即开始联合训练文本与视觉数据,预训练数据规模扩充至百TB量级,使视觉理解成为模型的原生能力而非后期附加模块。
MiniMax在发布页面展示了M3的多项实际任务表现:模型在无人干预下用约12小时自主复现了一篇ICLR 2025杰出论文的核心实验,产出18次代码提交与23张实验图表;在CUDA算子优化任务中,M3经过147次迭代将FP8矩阵乘的硬件峰值利用率从7.6%提升至71.3%,实现9.4倍加速。在PostTrainBench评测中,M3得分37.1,排名第三,位于Opus 4.7和GPT-5.5之后。
M3目前已通过API开放使用,提供标准版与高速版(M3-highspeed)两个接口。MiniMax同时宣布,M3即将在HuggingFace和GitHub上完成开源,支持私有集群部署与微调
官方博客:
https://minimaxi.com/models/text/m3
下面来简单测测实战效果





