DeepSeek版的Claude Code上热榜第一,8700星,鲸鱼哥出圈了

今天

TRAE SOLO移动端能用,手机也能干活,随时Vibe Working

TRAE SOLO

GRPO卡住了?G²RPO-A给自适应指导给小模型推理“开外挂”

今天

ACL 2026

Luma Uni-1.1 API开了,图像榜排第三,文字渲染快赶上GPT image 2了

今天

Uni-1.1-Max

比Transformer还牛?新架构搞出首个1200万上下文模型SubQ,成本只有Opus的5%

今天

SSA(Subquadratic Sparse Attention)

公里级场景也能稳住,国内团队把长视频3D重建又推进了一步

今天

3D 重建

820万合成分子、全部化学有效:CoCoGraph用534K参数把分子生成推到真实化学分布

今天

AI for Science

国内双开源:让Mac变成你私人的AI工作站

今天

Mano-P

DeepSeek版的Claude Code上热榜第一,8700星,鲸鱼哥出圈了

今天

DeepSeek TUI

阿里开源PromptEcho:用冻结多模态大模型给文生图训练提供高质量Reward

今天

PromptEcho

VLA不够看?触觉,可能要改写具身智能格局了

今天

Daimon-Infinity

ICLR 2026 | 救大命,手机Live Photo重选封面终于不糊了

今天

Live Photo

Anthropic联创定了deadline:2028年AI要能自我进化,没人类啥事了

05月05日

Jack Clark

大型挂机现场:马斯克那55万英伟达GPU,利用率才11%

05月05日

马斯克

Agent-World:扩展真实世界环境,让智能体跟环境一块进化!

05月05日

中国人民大学

计算机专业第三次大衰退?原因:AI

05月05日

计算机科学

CVPR 2026 Oral|横扫室内3D场景,港科大(广州)搞出单目开放词汇占据预测新SOTA

05月05日

LegoOcc

黄仁勋点名Anthropic的达里奥,别一当CEO,就开「上帝视角」

05月04日

Dario Amodei

ACL 2026|AI帮聋哑群体,港理工开源思考型手语翻译模型

05月04日

SignThought

DeepSeek搞大→Mega MoE,Tri Dao团队搞快→SonicMoE

05月04日

DeepSeek

ACL 2026|世界模型能让智能体“预知未来”?这篇新研究给了个反直觉答案

05月04日

Foresight Governance(前瞻治理)

这东西就那样,没宣传的那么神,用过就知道了。

小白问一下,DeepSeek版的Claude Code和原版到底有啥区别啊?我看帖子标题说了这个,但里面内容好像都在讲别的东西,是不是我理解错了?

又来这种帖子了,一天到晚热榜第一出圈的,过俩月谁还记得啊,都是炒作。

要体验的话直接去GitHub搜项目名字,clone下来按README的步骤装依赖跑demo就行。注意环境配置别冲突。

Mark,等周末有空了试试

看到SubQ那个1200万上下文成本只有5%挺心动的,但具体怎么实现的啊?帖子里那个“Subquadratic Sparse Attention”架构有论文链接吗?想看看技术细节,还有实际用起来长上下文效果稳不稳定,会不会有质量损失?

我之前用过一阵子类似的代码助手,感觉这类工具最大的问题不是技术本身,而是工作流整合。比如你本地开发环境怎么和它无缝衔接,快捷键冲突怎么解决,还有生成代码的风格和团队规范不一致就得手动改,反而更费时间。后来我就只用它来做一些样板代码生成或者查简单API用法了。DeepSeek这个TUI版本如果能解决这些体验问题,那8700星确实值得,不然热度过去也就那样。话说回来,这帖子里怎么混了这么多其他新闻,像是个合集,重点反而不突出了。

那篇论文arxiv能搜到,主要看attention稀疏化部分

去仓库看README说明就大概知道差异了

GitHub星速度有点离谱,估计是热度催的

改的是模型后端,前端体验差不多就是切换模型

那篇SubQuadratic Sparse Attention的论文arxiv能搜到

TRAE SOLO移动端的体验比预期顺,路上能改代码了

快捷键冲突这个真烦,每个工具都想占常用组合