Claude Opus 4.8 出了,编码和推理都有提升

Anthropic 把 Claude Opus 升级到了 4.8 版。比之前的 4.7 在编码、让 AI 自己干活(智能体)、推理还有处理知识工作这些方面,测试分数都更高了。现在已经能用,价格没变。

这次还加了几个新功能:用户可以自己控制让它干活的投入程度;Claude Code 多了个“动态工作流”;另外 Opus 4.8 的 2.5 倍速模式现在便宜了,只要以前三分之一的价格。

早期试过的人说,让它当智能体做判断更靠谱了,调用工具也更利索。在 Online-Mind2Web 这个测评里拿了 84% 的分数,超过了 Opus 4.7 和 GPT-5.5。另外,它更“诚实”了,跟人期望更对齐,代码出错的漏检率大概降了 75%。

小白问一下,这个“投入程度”具体怎么调啊?是不是在API参数里设置?我不太确定普通用户能不能用上这个功能。

动态工作流具体是啥?和之前Claude Code的区别在哪?能举个实际编码的例子吗?我看帖子提了但没说清楚怎么用。

编码推理都提升了,就是不知道日常感知明不明显

这价格没涨倒是不错,不过说实话最近这类升级见得多了。上次4.7也说提升明显,实际用起来该卡的地方还是卡。智能体判断更靠谱这个得长期观察,现在测评分数高不一定代表实际项目里稳定。我自己做自动化脚本的感受是,关键还是看复杂场景下的错误率,简单任务各家现在都差不多。另外那个2.5倍速降价倒是实在,之前贵得根本不敢开。

编码和推理提升是真的,知识工作那块我没感觉差太多

编码提升明显,复杂重构比上一版靠谱不少