Fable 5 定价分析:$50/M output,6月22日还有个悬崖

Fable 5 今天上线,先说定价:输入 $10/M token,输出 $50/M token,比 Opus 4.8 贵一倍,比 Gemini 3.1 Pro 贵 4-5 倍。

关键坑:Fable 5 的 adaptive thinking 是常开的,复杂任务一个 session 轻松跑到 50 万-100 万 token,算下来单次任务成本会比你预期高很多。

还有个时间节点要注意——6月22日之前,Pro/Max/Team/Enterprise 用户免费用,6月22日之后就要消耗额外用量额度了,两周时间评估对企业来说其实挺紧的。

我自己的判断:

  • 普通日常问答、写文案 → 用 Opus 4.8 就够了,没必要烧 Fable 5
  • 复杂 agentic coding、长上下文代码库分析 → Fable 5 值这个钱
  • 成本敏感的 API 项目 → 先跑测试算清楚 token 消耗再说,别到 6月22日才发现预算不够

API model ID 是 claude-fable-5,有在用的分享下实际 token 消耗情况?

真的假的,这价格直接劝退啊。

就这?比Gemini贵四五倍,坐等两周后降价。

自适应思考常开是个大问题,之前用DeepSeek做类似分析时,成本因为“内部思考”翻车过。新闻里没提Fable 5有没有开关或者可控阈值?万一跑个简单查询也触发深度思考,普通用户根本hold不住。

从行业角度看,这波定价非常Claude。它一直在强化“高质量思考”的差异化,把成本转嫁给需要极致精度的小众高端场景(比如复杂代理、代码库分析)。但对企业来说,两周评估期太短了,除非有现成的POC,否则很难全面测试成本。这可能会把很多成本敏感但有意向的客户推到Gemini甚至开源模型那边。

对我们这种接API做外包开发的小团队简直是噩梦。客户预算卡得死,现在得连夜做测试,算清楚一个典型工作流到底要烧多少token。最怕的是adaptive thinking不可控,同样的问题,今天50万token,明天可能80万,报价都没法报。

这波我看行,贵有贵的道理。之前用Opus做多步推理任务老是卡壳,如果Fable 5真能稳定输出更优解,贵一倍我也认,毕竟时间成本和结果质量更重要。就等实际测评了。

好奇追问:这个“输出”token定价$50/M,包含它“自适应思考”过程中生成的那些内部token吗?还是只算最后给我的答案?如果只算最后输出,那成本倒还好理解;如果连内部思考的都算成“输出”,那就有点坑了。

让我想起年初试用某家“思维链”特别强的模型,做一次数据清洗的代码生成,账单出来直接傻眼。后来才发现它默认开启了冗长推理模式,一个简单任务背后跑了十几轮自我验证。Fable 5这个定价策略,感觉就是把双刃剑,筛的就是愿意为确定性付费的客户。普通用户还是乖乖用便宜大碗的吧,别赶这个时髦。

预测一下后续:1. 两周免费期结束后,会有一波“账单惊吓”的吐槽潮。2. 社区很快会出现各种“成本控制最佳实践”,比如如何设计prompt让adaptive thinking收敛更快。3. 竞争对手(特别是Gemini和开源模型)会抓住这个定价空隙猛攻。不过,如果Fable 5在复杂任务上的效果真的断层领先,还是会形成稳固的高端市场。

楼主分析很中肯。日常用Opus,重活儿再考虑Fable 5,合理。但问题是我们怎么精准判断什么是“重活儿”?很多时候开始以为简单,模型一跑起来才发现进了复杂模式,token哗哗的。需要更精细的监控工具。

短期看贵,长期未必。如果它能大幅降低人工复审和迭代次数,整体项目成本可能是下降的。但这需要非常精细的测算和对比,两周时间对企业决策来说,确实像站在悬崖边评估要不要跳。

用过claude-fable-5的兄弟快来分享一下实际token消耗啊!正在写评估报告,在线等,挺急的。

50刀输出加上6月22的悬崖,小团队真心扛不动

我也想问那50刀是只算最终输出还是连思考的token一起算,差很多

日常用便宜的重活儿再上它,问题是怎么提前判断哪些是重活儿

思考过程那些中间token也计费,这才是大头