新架构第一个1200万上下文模型来了，成本只有Opus的5%

rustxiax · 2026 年5 月 6 日 15:27

今天

TRAE SOLO移动端能用了，手机也能干活，随时Vibe Working

GRPO卡住了？G²RPO-A给小模型推理能力上外挂

今天

ACL 2026

Luma Uni-1.1 API开了，图像榜第三，文字渲染快赶上GPT image 2了

今天

Uni-1.1-Max

跑在Transformer前面了！新架构第一个1200万上下文模型SubQ，成本只要Opus的5%

今天

SSA（Subquadratic Sparse Attention）

公里级大场景也能稳，国产团队把长视频3D重建又推进了一步

今天

3D 重建

820万合成分子、全部化学有效：CoCoGraph用53万参数把分子生成搞得更真了

今天

AI for Science

国产双开源项目，能让Mac变私人AI工作站

今天

Mano-P

DeepSeek版Claude Code上热榜了：8700星，鲸鱼哥火了

今天

DeepSeek TUI

阿里开源PromptEcho：用冻结的多模态大模型给文生图训练当高质量Reward

今天

PromptEcho

光VLA不够？触觉可能要改写具身智能的格局

今天

Daimon-Infinity

ICLR 2026 | 救命，手机Live Photo重选封面终于不糊了

今天

Live Photo

Anthropic联创定了deadline：2028年AI要能自我进化

05月05日

Jack Clark

大型挂机现场：马斯克的55万英伟达GPU，利用率才11%

05月05日

马斯克

Agent-World：扩展真实世界环境，让智能体和环境一起进化

05月05日

中国人民大学

计算机科学专业第三次大衰退？原因：AI

05月05日

计算机科学

CVPR 2026 Oral｜横扫室内3D场景，港科大（广州）搞了个单目开放词汇占据预测新SOTA

05月05日

LegoOcc

黄仁勋点名Anthropic达里奥，别一当CEO就开上帝视角

05月04日

Dario Amodei

ACL 2026｜AI for聋哑群体，港理工开源了个思考型手语翻译模型

05月04日

SignThought

DeepSeek搞大模型→Mega MoE，Tri Dao团队搞快模型→SonicMoE

05月04日

DeepSeek

ACL 2026｜世界模型能让智能体预知未来？这篇研究给了个反直觉的答案

05月04日

Foresight Governance（前瞻治理）

fullstackzhangx · 2026 年5 月 6 日 15:42

这东西也就吹得凶，实际落地还得看。

shrmx · 2026 年5 月 6 日 23:00

小白问一下，新架构那个1200万上下文模型SubQ，是不是意味着以后本地跑超大文档总结之类的活成本会低很多啊？我不太确定这5%是咋算出来的。

websongcode · 2026 年5 月 6 日 23:08

又来这种帖子了，每天一个新架构突破一个成本降低，看得人眼花缭乱，最后能用在产品里的有几个？上次那个GRPO吹得也挺猛，现在卡住了吧。

makerpengwork · 2026 年5 月 6 日 23:22

Luma那个Uni-1.1 API接口地址有吗？申请门槛高不高？有没有人已经试过了，文字渲染效果到底怎么样，跟DALL-E3比呢？

pylunet · 2026 年5 月 6 日 23:24

前几天刚折腾过本地部署大模型，那个让Mac变私人AI工作站的项目我试了。步骤其实不难，先装好Homebrew，然后用他们给的脚本一键部署，M2芯片跑7B的模型基本流畅，就是发热有点厉害。内存16G的话得小心点，别同时开太多程序。

yolo_deploy · 2026 年5 月 6 日 23:34

触觉那个挺有意思的，感觉不完全是技术帖讨论的范畴了。最近看新闻波士顿动力的机器人好像也在强化触觉感知，是不是意味着以后机器人做精细活，比如穿针引线或者外科手术，必须得有这个？这算不算AI从虚拟走向物理世界的一个关键门槛？单纯靠视觉肯定不够稳。

techfenglog · 2026 年5 月 6 日 23:44

跑题说一句，这帖子配图是不是有点太多了，加载半天，流量党哭了。不过那个长视频3D重建的图效果看着确实牛，是用的哪个数据集做的演示啊？

onchain_ops · 2026 年5 月 6 日 23:56

上次用Opus的API处理一批长文档，账单出来心都在滴血。要是这个SubQ真能把成本打到5%还能保持可用性，那绝对是革命性的。我特别关注它那个SSA注意力机制，稀疏化是怎么做的？对信息提取的完整性影响大不大？有没有已经公开的论文或者技术报告可以看？

nodezhengist · 2026 年5 月 7 日 00:02

同问，坐等大佬解答。

mooncalls · 2026 年5 月 7 日 15:54

成本压到5%还能保持可用就是革命性的

terragato · 2026 年5 月 14 日 06:58

千倍上下文加5%成本如果是真的，长文档场景算是被打爆了

tofulover · 2026 年5 月 20 日 01:10

如果真能做到5%，长文档处理场景会被彻底改写

weizijia · 2026 年5 月 22 日 13:32

5%成本听着像PR话术，等第三方验证再说