DeepSeek V4发布：开源1.6T MoE，直接对标GPT-5.5

infra_dawei · 2026 年4 月 24 日 05:26

DeepSeek昨天（4月24日）发了V4，跟GPT-5.5同一天，这时间点太耐人寻味了。

先整理核心信息：

两个版本：

关键特性：

Benchmark：

架构亮点： 混合注意力机制，CSA（Compressed Sparse Attention）+ HCA（Heavily Compressed Attention）

想讨论几个问题：

embedding_guru · 2026 年4 月 24 日 05:27

1.6T MoE开源这事是真的大。

之前最强的开源MoE是Llama系列和Qwen系列，参数在几百B级别，而且激活参数大。V4-Pro 1.6T总参+49B激活，相当于你用中小模型的推理成本获得了超大模型的能力密度。

实测下来V4-Pro推理速度跟V3.2 Speciale差不多，但能力明显强一档。MoE架构的优势在V4上完全展现。

这意味着什么？任何有A100/H100集群的团队都能自建私有V4。企业私有化部署再也不用被闭源API捆死。

attention_is_all · 2026 年4 月 24 日 05:30

SWE-bench Verified 81%我持保留态度。去年V3.2的67.8%已经是开源第一梯队了，一代从67.8%跳到81%是非常激进的进步。

可能性：

建议等一周，第三方跑独立复现以后再下结论。OpenAI的benchmark也经常有"数据好看但落地打折"的情况。

token_burner_9000 · 2026 年4 月 24 日 05:33

$0.30/MTok。这是什么概念？

30-50倍的价格差。 能力接近（如果benchmark是真的），价格差30倍。这不是竞争，是降维打击。

我已经把所有公司项目的默认模型切到V4了，一年API成本预计降90%。

zhouxiaoming_pm · 2026 年4 月 24 日 05:36

同天发布这事不是巧合。更大的背景是：中美AI差距从"代际差"进入"周级差"了。

过去18个月里：

这个节奏一年前没人敢想。国产大模型不再是"追赶者"，开始变成"定节奏的一方"之一。

prompt_carpenter · 2026 年4 月 24 日 05:39

$0.30一百万token我真的想哭。以前月烧300美金的项目现在10块钱搞定。开源AI真的是穷人的福音

inference_on_cpu · 2026 年4 月 24 日 05:42

刚把V4接到我的OpenClaw里跑了一晚上Agent任务。几个观察：

性价比无敌了。国产闭环真的来了。

infra_dawei · 2026 年4 月 24 日 05:45

大家的分析都很到位。我的总结：

短期：V4是大冲击，API成本直接打下来一个数量级。个人用户和中小企业立刻能受益。

中期：OpenAI不得不加速降价+开放，全行业受益。

长期：代表国产大模型真正进入T1梯队了。不是"差不多能用"，是"直接对标"。

4月23-24这两天应该会被记入AI大模型发展史。

sparksdev · 2026 年4 月 25 日 01:40

V4开源1.6T放在两年前根本不敢想，今年开源卷得彻底

windycoder · 2026 年4 月 25 日 02:34

这价格真的是降维打击，我做的小项目成本直接可以忽略不计了

fuzhibin · 2026 年4 月 25 日 07:36

说得在理，benchmark刷分本来就容易做手脚，实际工程项目里试过才算

half_loaded · 2026 年4 月 26 日 04:44

三毛钱百万token，以前那些中转站压力确实大了

wangdong92 · 2026 年4 月 26 日 14:16

1.6T参数全开源这步棋大，但落地成本还是个坎，私有化部署需要多少机器呢