2022年底ChatGPT发布到现在不过三年多,AI的发展速度超出了所有人的预期。来理一下这条进化线。
第一阶段:AI会说话了(2023)
ChatGPT出来,全民震惊。原来AI可以这么流畅地对话、写文章、回答问题。但本质上它只是一个"嘴炮高手"——说得天花乱坠,一个字的实际操作都做不了。
AutoGPT在这一年出现了,让人第一次看到AI自主规划的可能性。但体验粗糙得像半成品,基本没法实用。
第二阶段:AI能看了(2024-2025)
多模态大模型成熟了。AI不光能看文字,还能理解图片、看懂屏幕。各大厂开始布局Agent框架,但多数还是实验室产品。
GPT-4V、Claude 3、Gemini这些多模态模型的出现,为后面的Agent时代打下了基础。因为Agent要操控电脑,首先得能"看懂"屏幕上有什么。
第三阶段:AI能动手了(2026)
OpenClaw来了。它把所有的技术碎片拼在了一起——大模型的理解力 + Playwright的操控力 + 记忆系统的延续性 + 工具链的扩展性。
第一次,AI真正从"对话"跨到了"执行"。你跟它说一句话,它就去你电脑上干活。
然后国产化大潮涌来——KimiClaw、QClaw、AutoClaw、MoliliClaw,一夜之间十几个产品上线。大厂小厂全部入局。
第四阶段正在酝酿:AI成为同事(2026-?)
OpenClaw还是个人工具。但已经有产品(比如Junior)在探索让AI成为团队里的真正成员——有自己的邮箱、自己的工作账号、自己的权限。
两个AI在Slack里互相协作推进项目,人类负责监督。这不是科幻,是已经在发生的事。
现在到底该怎么做
不要试图一步跳到最前沿。根据你的技术水平和实际需求,找到合适的切入点:
- 零基础:先用ChatGPT/Claude/Kimi,把"AI辅助"这件事做好
- 有基础:试试飞书版龙虾或云端OpenClaw,感受"AI执行"是什么体验
- 技术党:自己部署原版OpenClaw,深入学习Agent架构
- 开发者:研究SDK和Skill开发,这是目前最大的红利窗口
每个阶段都有自己的最优解。关键是动起来,而不是站在原地焦虑。