新架构第一个1200万上下文模型来了,成本只有Opus的5%

今天

TRAE SOLO移动端能用了,手机也能干活,随时Vibe Working

GRPO卡住了?G²RPO-A给小模型推理能力上外挂

今天

ACL 2026

Luma Uni-1.1 API开了,图像榜第三,文字渲染快赶上GPT image 2了

今天

Uni-1.1-Max

跑在Transformer前面了!新架构第一个1200万上下文模型SubQ,成本只要Opus的5%

今天

SSA(Subquadratic Sparse Attention)

公里级大场景也能稳,国产团队把长视频3D重建又推进了一步

今天

3D 重建

820万合成分子、全部化学有效:CoCoGraph用53万参数把分子生成搞得更真了

今天

AI for Science

国产双开源项目,能让Mac变私人AI工作站

今天

Mano-P

DeepSeek版Claude Code上热榜了:8700星,鲸鱼哥火了

今天

DeepSeek TUI

阿里开源PromptEcho:用冻结的多模态大模型给文生图训练当高质量Reward

今天

PromptEcho

光VLA不够?触觉可能要改写具身智能的格局

今天

Daimon-Infinity

ICLR 2026 | 救命,手机Live Photo重选封面终于不糊了

今天

Live Photo

Anthropic联创定了deadline:2028年AI要能自我进化

05月05日

Jack Clark

大型挂机现场:马斯克的55万英伟达GPU,利用率才11%

05月05日

马斯克

Agent-World:扩展真实世界环境,让智能体和环境一起进化

05月05日

中国人民大学

计算机科学专业第三次大衰退?原因:AI

05月05日

计算机科学

CVPR 2026 Oral|横扫室内3D场景,港科大(广州)搞了个单目开放词汇占据预测新SOTA

05月05日

LegoOcc

黄仁勋点名Anthropic达里奥,别一当CEO就开上帝视角

05月04日

Dario Amodei

ACL 2026|AI for聋哑群体,港理工开源了个思考型手语翻译模型

05月04日

SignThought

DeepSeek搞大模型→Mega MoE,Tri Dao团队搞快模型→SonicMoE

05月04日

DeepSeek

ACL 2026|世界模型能让智能体预知未来?这篇研究给了个反直觉的答案

05月04日

Foresight Governance(前瞻治理)

这东西也就吹得凶,实际落地还得看。

小白问一下,新架构那个1200万上下文模型SubQ,是不是意味着以后本地跑超大文档总结之类的活成本会低很多啊?我不太确定这5%是咋算出来的。

又来这种帖子了,每天一个新架构突破一个成本降低,看得人眼花缭乱,最后能用在产品里的有几个?上次那个GRPO吹得也挺猛,现在卡住了吧。

Luma那个Uni-1.1 API接口地址有吗?申请门槛高不高?有没有人已经试过了,文字渲染效果到底怎么样,跟DALL-E3比呢?

前几天刚折腾过本地部署大模型,那个让Mac变私人AI工作站的项目我试了。步骤其实不难,先装好Homebrew,然后用他们给的脚本一键部署,M2芯片跑7B的模型基本流畅,就是发热有点厉害。内存16G的话得小心点,别同时开太多程序。

触觉那个挺有意思的,感觉不完全是技术帖讨论的范畴了。最近看新闻波士顿动力的机器人好像也在强化触觉感知,是不是意味着以后机器人做精细活,比如穿针引线或者外科手术,必须得有这个?这算不算AI从虚拟走向物理世界的一个关键门槛?单纯靠视觉肯定不够稳。

跑题说一句,这帖子配图是不是有点太多了,加载半天,流量党哭了。不过那个长视频3D重建的图效果看着确实牛,是用的哪个数据集做的演示啊?

上次用Opus的API处理一批长文档,账单出来心都在滴血。要是这个SubQ真能把成本打到5%还能保持可用性,那绝对是革命性的。我特别关注它那个SSA注意力机制,稀疏化是怎么做的?对信息提取的完整性影响大不大?有没有已经公开的论文或者技术报告可以看?

同问,坐等大佬解答。

成本压到5%还能保持可用就是革命性的

千倍上下文加5%成本如果是真的,长文档场景算是被打爆了