开源和闭源模型,走的是两条道

说到底,开放和封闭的AI模型以后谁能占上风,关键还是钱的问题——用户愿不愿意一直为最好的闭源模型付那个高价。今年初,编程智能体算是开了个头,让人看到第一个大AI市场,确实有人肯为更牛的智能多掏钱。

反过来,那些顶级实验室的API生意,迟早得往下走。他们会想着得把自己最好的模型藏起来,API放出来的更晚,好保住令牌生意,防着知识蒸馏,只做利润最高的活儿。这些影响过个5到10年会更明显,因为眼下这阵子,价格、利润还有需求,主要还是靠算力狂扩(短期缺货)和大把撒钱补贴令牌(新AI公司一直有投资撑着)来决定的。

我觉得吧,现在编程智能体已经冲过了Opus 4.5和Codex 5.2那个坎儿,大家习惯真的变了。不是因为懒,是用了它们帮忙处理复杂活儿,效率就是高。靠这个吃饭的人,肯定会选最好的,而不是凑合。想把产品做更好,路子多着呢:速度、聪明劲儿、专用模型啥的。

我现在就愿意每月花2000刀用这些工具,尤其是知道它们还会厉害得多。当然,肯定也有不少公司在硬推智能体给那些现在还用不太上的人,这也在帮着AI接着扩张(或者说吹泡泡)。

最好的闭源实验室——现在看就Anthropic和OpenAI,谷歌估计也能赶上——总能做出性价比最高的聪明模型。造模型这玩意儿,烧钱烧得厉害,人才、数据、算力都得往里砸。这些系统,把模型权重、控制框架、工具和服务都打包在一起,集成起来好处巨大(而开源模型更偏向适配各种服务场景)。这种软硬件结合的优势,能用各种方式让模型变得更强。

短期内,模型的跑分可能快到头了,但如果聪明程度真卡住了,那实验室就会去优化每秒或者每瓦特能干的活儿,换种方式服务用户。模型的改进空间到处都有,一直没碰到死胡同。我们还处在智能大基建的早期,得盖一大堆数据中心,把大量AI研究员组织起来搞大模型,还得解决无数小问题来释放性能。怎么看都还有不少潜力可挖,而闭源实验室最擅长干这个。

实验室们大概都觉得,把模型的绝对智能往前推,价值最大。我也觉得没错,因为这能打开巨大的新市场。要是在一个固定的智能水平上使劲儿优化,那就把市场锁死了,只能慢慢扩大用户群,提高用户的回报(但卖智能的利润可能反而会降)。

好多人都在赌模型会一直变好,也愿意学着在这些控制框架里干活,哪怕现在有些工作流还有点别扭。这赌注下得对。这些人都会接着用能搞到的最好模型。就跟买手机似的,你可以买安卓,忍着各种小毛病省钱,但何必呢?在工作上,性能带来的回报更高,这让他们有底气定高价。

这么看的话,站在前沿的这些实验室企业,以后会像个全新版本的苹果和微软混合体。像苹果的地方是,他们卖的是高度集成、别人很难复制的技术。像微软的地方是,他们向整个经济体卖高杠杆的订阅服务。我估计5到10年内,OpenAI和Anthropic的估值能到2到10万亿美元这个量级。真正的前沿实验室会形成一个寡头垄断,就跟现在的云市场差不多。

另一边是开源模型经济。不是说前沿实验室会统治AI的所有方面。对,我猜OpenAI和Anthropic会是这波AI热潮里最显眼的公司(新公司嘛,当然还有英伟达),但围绕开源模型捕获的总价值,整体上会大得多,只不过收入和利润会被一大串公司给分掉。

不少企业想转向开源模型,但现在的模型处理分布外任务还不够好。最终,开源模型的建设者们会停止在Artificial Analysis指数上追赶Claude和GPT,去填补这个细分市场。这种分化可能是经济驱动的,比如他们没那么多收入去支撑持续扩张模型所需的高研发成本了。也可能是纯粹的需求驱动的,因为有些AI解决方案只能存在于开源模型提供的低价位上。闭源实验室是寡头,而开源模型的构建者和用户会更加分散、数量更多。总的市场价值会远超OpenAI和Anthropic加起来的价值。

开源模型天生_不_是集成的,所以它们得靠一堆公司协调着来提供服务。每一层都会有替代品,把价格打到接近白菜价。这种低价、可预测的价格,会是很多企业入场的地方,用来给自己特定的任务做内部智能体和工具。主要的部署模式是,企业找到一个在感兴趣的任务上性能够用的模型,然后基本就不换了(换起来成本太高)。随着定制模型越来越容易——从新兴的开源模型微调栈(Tinker, Fireworks, Prime Intellect这些)也能看出来——这个市场会变得更大。

接下来几年的景象大概是,在谷歌、亚马逊、微软这些老牌云巨头,还有Together、Fireworks、OpenRouter这些新的AI基础设施公司那儿,开源模型推理的比例会稳步上升,慢慢超过OpenAI和Anthropic。

关键就在于,开源和闭源模型的经济,跑的是两条不同的指数曲线。我还是相信_整个生态_会继续快速往前冲,但那种说“递归自我改进会给闭源实验室不可动摇优势”的说法,我觉得太夸张了。像后台智能体这种新形态的产品,可以同时支持开源和闭源模型。

闭源模型靠着现在的智能体实现了惊人的产品匹配,通过把高端知识工作变现,开始了它们的集成化指数增长。开源模型经济需要的时间会更长,但看着它发展会更让人满足,因为它追踪的是AI更广泛地扩散到整个经济和世界的过程。

1

“编程智能体”这词儿挺有意思,因为我们几乎不在里面写代码。它们是通用智能体,之所以这么强,是因为它们能写一大堆代码。

闭源估计最后还是贵,但总有人买单,不然怎么持续创新?不过开源那边也挺有潜力的,适合预算有限又想试试的公司。

这东西就那样,别想太多。

小白问一下,为啥闭源模型就得这么贵啊?是研发成本太高了吗?我不太确定是不是所有公司都非得用最好的模型不可……

楼主的分析挺有意思,不过我突然想起自己去年用开源模型做内部工具的经历。当时选了Llama 2微调,虽然效果没Claude那么强,但成本低啊,一个月才几百块,团队用着也够了。其实很多场景真的不需要顶尖智能,够用就行,还能自己改。

又来这种帖子了,每次都说开源闭源两条路,最后不还是谁便宜用谁?真用起来哪有那么多大道理。

你提到编程智能体冲过了Opus 4.5那个坎儿,具体是哪些任务上效率提升明显?能举个例子吗,比如代码生成还是调试?

认同闭源贵但有人买单,不过开源追得也快,差距没那么大了

闭源拼前沿能力,开源拼可控和成本,本来就两条线

微调开源做内部工具确实划算,要求没那么高的场景几百块够用

你这思路对,内部工具用开源微调真香,没必要为闭源付高价

开源闭源各有各的活法,非要分高下没意义

Llama微调内部工具这路子我也走过,省钱是真省,就是效果将就