Fable 5 今天上线,先说定价:输入 $10/M token,输出 $50/M token,比 Opus 4.8 贵一倍,比 Gemini 3.1 Pro 贵 4-5 倍。
关键坑:Fable 5 的 adaptive thinking 是常开的,复杂任务一个 session 轻松跑到 50 万-100 万 token,算下来单次任务成本会比你预期高很多。
还有个时间节点要注意——6月22日之前,Pro/Max/Team/Enterprise 用户免费用,6月22日之后就要消耗额外用量额度了,两周时间评估对企业来说其实挺紧的。
我自己的判断:
- 普通日常问答、写文案 → 用 Opus 4.8 就够了,没必要烧 Fable 5
- 复杂 agentic coding、长上下文代码库分析 → Fable 5 值这个钱
- 成本敏感的 API 项目 → 先跑测试算清楚 token 消耗再说,别到 6月22日才发现预算不够
API model ID 是 claude-fable-5,有在用的分享下实际 token 消耗情况?
自适应思考常开是个大问题,之前用DeepSeek做类似分析时,成本因为“内部思考”翻车过。新闻里没提Fable 5有没有开关或者可控阈值?万一跑个简单查询也触发深度思考,普通用户根本hold不住。
从行业角度看,这波定价非常Claude。它一直在强化“高质量思考”的差异化,把成本转嫁给需要极致精度的小众高端场景(比如复杂代理、代码库分析)。但对企业来说,两周评估期太短了,除非有现成的POC,否则很难全面测试成本。这可能会把很多成本敏感但有意向的客户推到Gemini甚至开源模型那边。
对我们这种接API做外包开发的小团队简直是噩梦。客户预算卡得死,现在得连夜做测试,算清楚一个典型工作流到底要烧多少token。最怕的是adaptive thinking不可控,同样的问题,今天50万token,明天可能80万,报价都没法报。
这波我看行,贵有贵的道理。之前用Opus做多步推理任务老是卡壳,如果Fable 5真能稳定输出更优解,贵一倍我也认,毕竟时间成本和结果质量更重要。就等实际测评了。
dsktz
8
好奇追问:这个“输出”token定价$50/M,包含它“自适应思考”过程中生成的那些内部token吗?还是只算最后给我的答案?如果只算最后输出,那成本倒还好理解;如果连内部思考的都算成“输出”,那就有点坑了。
让我想起年初试用某家“思维链”特别强的模型,做一次数据清洗的代码生成,账单出来直接傻眼。后来才发现它默认开启了冗长推理模式,一个简单任务背后跑了十几轮自我验证。Fable 5这个定价策略,感觉就是把双刃剑,筛的就是愿意为确定性付费的客户。普通用户还是乖乖用便宜大碗的吧,别赶这个时髦。
预测一下后续:1. 两周免费期结束后,会有一波“账单惊吓”的吐槽潮。2. 社区很快会出现各种“成本控制最佳实践”,比如如何设计prompt让adaptive thinking收敛更快。3. 竞争对手(特别是Gemini和开源模型)会抓住这个定价空隙猛攻。不过,如果Fable 5在复杂任务上的效果真的断层领先,还是会形成稳固的高端市场。
楼主分析很中肯。日常用Opus,重活儿再考虑Fable 5,合理。但问题是我们怎么精准判断什么是“重活儿”?很多时候开始以为简单,模型一跑起来才发现进了复杂模式,token哗哗的。需要更精细的监控工具。
短期看贵,长期未必。如果它能大幅降低人工复审和迭代次数,整体项目成本可能是下降的。但这需要非常精细的测算和对比,两周时间对企业决策来说,确实像站在悬崖边评估要不要跳。
用过claude-fable-5的兄弟快来分享一下实际token消耗啊!正在写评估报告,在线等,挺急的。
我也想问那50刀是只算最终输出还是连思考的token一起算,差很多
日常用便宜的重活儿再上它,问题是怎么提前判断哪些是重活儿