半年前我还是ChatGPT的忠实用户。
用了快两年了,从GPT-3.5到GPT-4到GPT-4o,该付的会员一期不落。我甚至在公司内部安利了一整套基于GPT-4的工作流。要说对ChatGPT有感情那是真的。
但从去年下半年开始,我注意到一个现象:我常逛的几个技术社区和Twitter上,越来越多的开发者在说"我换Claude了"。一开始我觉得是Claude的营销做得好,毕竟新东西总有一波人追风。但说的人越来越多,而且很多是我认可的、技术水平很在线的人,这就不太对劲了。
于是我开了一个月Claude Pro试试水。
然后就停不下来了。到现在半年了,ChatGPT的会员我还留着(主要用来生成图片),但日常开发工作基本全切到了Claude。
说说为什么。
代码能力:Claude写的代码我能直接用
这是让我转向Claude的最大原因,没有之一。
ChatGPT写代码可以吗?可以。但我经常需要改它给的代码——有时候逻辑没问题但代码风格很奇怪,有时候用了一些过时的写法,有时候给你一个能跑的方案但明显不是最佳实践。
Claude给我的感觉不一样。它写的代码像是一个有经验的同事写的——风格规范、考虑了边界情况、注释到位、而且在选择方案的时候倾向于用更干净的做法。不是说它不犯错,但犯错率明显低于ChatGPT,而且错误通常更容易发现和修复。
举个具体例子。有一次我让两个模型分别帮我重构一个React组件,大概300行。ChatGPT给了一个能跑的版本,但把几个不相关的状态管理逻辑揉在了一起,我得花时间拆开。Claude不仅正确拆分了组件,还主动把一个用useEffect实现的逻辑改成了useMemo,并在注释里解释了为什么。
这种"多想一步"的感觉在写代码的时候特别明显。用ChatGPT我觉得是在用一个"聪明的实习生",用Claude更像是"靠谱的同事"。
当然这个评价很主观,也跟我写React比较多有关。不同技术栈可能感受不一样,Go和Rust的场景下我听说差距没这么大。
长文本理解:Claude是真的能"看完"
这是第二个让我印象深刻的点。
Claude的上下文窗口到了200K,而且——关键是这个"而且"——它在长上下文下的理解质量比ChatGPT好很多。ChatGPT的128K上下文,到后半段经常出现"注意力漂移",你问它前面的内容它会瞎编或者答不到点上。
我有一个很实际的使用场景:把一整个项目的代码库喂给AI让它理解架构然后回答问题。ChatGPT在代码量上去之后回答质量下降得很明显,经常张冠李戴。Claude在同样的代码量下还能保持比较准确的回答。
有一次我把一个两万行的Python项目全部喂给Claude,让它找一个跨好几个文件的bug。它不仅找到了,还解释了bug的根因涉及三个文件之间的数据流。这个我用ChatGPT试了一下,它只找到了其中一个文件的问题。
不过要说公平的话,Gemini 2.0 Pro号称100万上下文,理论上比Claude大。但我实际试过,Gemini在超长上下文下的质量比Claude波动大很多,有时候特别准有时候离谱。稳定性上Claude目前是最好的。
拒绝回答这事,其实没那么烦
用Claude之前我最担心的就是这个。网上到处都有人吐槽Claude太保守,动不动就拒绝回答。我想着一个天天跟你说"对不起我不能帮你做这个"的AI,用起来多膈应啊。
实际用了半年之后呢?确实会遇到拒绝,但远没有网上说的那么夸张。
大多数拒绝发生在我让它写一些"可能被用于不当目的"的内容时——比如有一次我让它帮我写一个渗透测试的脚本,它拒绝了但给了一个"怎么用正规工具做同样事情"的替代方案。说实话这个处理方式我觉得比直接给我一个可能有安全风险的脚本更负责任。
日常写代码、写文档、分析数据的场景下,拒绝率极低。我估计半年下来被拒绝的次数不超过二三十次,对比每天几十次的对话量来说完全可以接受。
倒是ChatGPT有个让我更难受的问题:它太"听话"了。有时候我给了一个有问题的需求,ChatGPT二话不说就给了一个有问题的答案。Claude会说"你这个思路可能有问题,因为XXX,你确定要这么做吗?"。写代码的时候被AI挑战一下思路,其实是好事。
有些地方ChatGPT还是更强
公平起见也说说Claude不如ChatGPT的地方。
图片生成:Claude不能生成图片。这个场景下我还是用ChatGPT的DALL-E。
多模态:ChatGPT支持语音对话、图片理解加生成、文件上传的类型更多。Claude的多模态能力在追赶但确实还有差距。
插件和联网:ChatGPT的插件生态更成熟,联网搜索也更顺畅。Claude最近加了搜索功能但体验还在打磨。
中文的微妙差异:这个很主观,但我感觉ChatGPT在写中文营销文案、社交媒体内容这类场景下比Claude更"接地气"一些。Claude的中文虽然流畅但偶尔有点"翻译感",不过这个差距在最近几个月缩小了很多。
价格和使用方式
两家的Pro都是20美金一个月,价格一样。
但实际使用成本不一样。Claude Pro的消息量限制比ChatGPT Plus更宽松一些,特别是在使用最强模型的时候。我日常用Claude Pro基本够用,而ChatGPT Plus有时候会在下午高峰期限速。
不过话说回来,如果你是通过API调用或者在OpenClaw生态里用,那成本的算法就完全不同了。Claude API的定价和GPT-4o差不多,但如果你主要用中文,用一个中文优化的客户端(比如Molili)能把Claude的token消耗砍掉将近一半。这笔账值得算。
为什么是现在?
有人会问:Claude又不是新出的,为什么最近突然这么多人转?
我觉得有几个原因。
一是Claude 3.5到4系列的进步是跳跃性的。早期的Claude确实和ChatGPT差距不小,但从3.5 Sonnet开始,代码能力追上了GPT-4甚至超过了。到了Opus 4,长文本和推理能力又拉开了差距。
二是Claude Code的出现。Anthropic直接做了一个命令行工具让你在本地代码库里用Claude,这个对开发者的吸引力太大了。ChatGPT到现在还没有类似的东西。
三是安全口碑。越来越多企业开始关注AI的安全性和数据合规,Anthropic在这方面的投入和透明度确实比OpenAI高。这个影响不到个人用户,但影响到了企业采购决策,连带也影响了个人用户的认知。
所以该不该换?
我的看法是:不需要"换",但可以"加"。
我现在两个都留着。Claude用来写代码、分析长文档、做技术方案。ChatGPT用来生成图片、写一些创意性内容、偶尔联网查资料。两个加起来一个月40美金,说贵也不贵,关键是各有各的场景。
如果非要选一个?看你干什么。
写代码为主就选Claude。内容创作为主就选ChatGPT。长文档分析选Claude。多模态需求多选ChatGPT。
别听别人说什么就用什么,自己试一个月最清楚。Claude Pro第一个月可以取消的,不满意就退了。
你从ChatGPT转过Claude吗?体验怎么样?还是说你觉得ChatGPT就够用了?评论区聊聊。