Anthropic 把 Claude Opus 升级到了 4.8 版。比之前的 4.7 在编码、让 AI 自己干活(智能体)、推理还有处理知识工作这些方面,测试分数都更高了。现在已经能用,价格没变。
这次还加了几个新功能:用户可以自己控制让它干活的投入程度;Claude Code 多了个“动态工作流”;另外 Opus 4.8 的 2.5 倍速模式现在便宜了,只要以前三分之一的价格。
早期试过的人说,让它当智能体做判断更靠谱了,调用工具也更利索。在 Online-Mind2Web 这个测评里拿了 84% 的分数,超过了 Opus 4.7 和 GPT-5.5。另外,它更“诚实”了,跟人期望更对齐,代码出错的漏检率大概降了 75%。