AI算力重心从云端转向边缘,这个拐点来了吗?

最近明显感觉到一个趋势:越来越多的AI推理任务开始往端侧跑了。苹果、高通、联发科都在拼命堆端侧AI算力,各种NPU性能年年翻倍。手机上跑7B模型已经不是新鲜事了。

但我有个疑问:这个"从云到边缘"的转移,是真的到拐点了,还是芯片厂商为了卖货营造的叙事?

几个观察:

  • 端侧推理延迟低、隐私好、不依赖网络,这些优势是真的
  • 但端侧算力天花板摆在那里,跑个7B勉强,70B想都别想
  • 云端的优势是弹性扩展和模型能力上限,这个短期替代不了

大家怎么看?AI算力的未来到底是云端为主还是端云混合?


2 个赞

在芯片公司干了五年,说说行业内部的真实看法。

拐点确实在来但不是"替代"而是"分层"。未来大概率是这样的格局:

端侧负责轻量推理:语音助手、实时翻译、图像识别、简单对话。特点是低延迟、隐私好、离线可用。7B-14B模型在端侧已经跑得不错了。

云端负责重型任务:复杂推理、大规模数据分析、模型训练、多Agent协作。这些任务端侧算力根本扛不住。

所以不是"从云到边缘"而是"云+边缘"。 轻的活下放端侧省成本省延迟,重的活还是得上云。芯片厂商的叙事有夸大成分但趋势本身是真的。

端侧NPU性能每年翻倍这个速度确实猛。两三年后手机上跑14B级别模型应该很流畅了。但同期云端模型也在进化——端侧追的是一个移动靶。


2 个赞

说个不太受欢迎的观点:端侧AI更多是营销叙事而不是技术趋势。

手机上跑7B模型又怎样?体验跟云端的GPT-4o差了几条街。用户要的是好用的AI不是本地跑的AI。隐私?说实话普通用户根本不在乎。延迟?5G时代云端延迟也够低了。

端侧AI目前最实际的场景就是拍照优化、语音唤醒这些。复杂AI任务离不开云端这个事实短期内不会变。

芯片厂商鼓吹端侧AI本质上是为了给NPU卖溢价。


2 个赞

两边说的都有道理。我觉得关键变量是成本

云端推理是按token收费的,用得越多花得越多。端侧推理是一次性硬件投入,后续零边际成本。当端侧能力达到"够用"的水平(而不是"最强"),很多场景从成本角度就会自然迁移到端侧。

现在OpenClaw生态里已经有MiLoCo这种走端侧路线的产品了,当贝Molili也支持接本地模型。端云混合不是未来而是已经在发生的事情。


1 个赞

芯片厂商说端侧AI是未来,云厂商说云端AI是未来。都对也都在给自己卖货。别信任何一边的叙事,看实际场景需要什么就用什么。


3 个赞

综合下来"分层协作"应该是最靠谱的判断。端侧做轻活、云端做重活,而不是谁替代谁。拐点与其说是"转向"不如说是"分流"。

1 个赞

边缘计算+AI在工业场景确实有需求,但消费端还没到拐点

手机跑7B确实新鲜但体验比云端差得远

分层协作这词用得精准,端云各司其职才对

边缘计算+AI在工业场景确实有需求,但消费端还没到拐点

边缘端推理这事说了三年了 真正落地的场景依然屈指可数

手机端跑小模型已经很流畅了,确实不是所有任务都要上云

边缘计算确实是趋势,手机端推理越来越快了

云端模型太大搬不下去 边缘小模型又不够用 拐点还没到

分层不是替代这观点对,端侧轻量云端重型各干各的

营销叙事这话有道理,端侧7B离实用还差几条街