如题,前些日子在论坛里和各位佬友分享了许多自己的有关OpenClaw的一些经验和优化的内容,但是现在已经力竭了。
我的目标是希望可以打造一个,我只要提出产品的大概想法,然后就可以让OpenClaw联动其他的AI工具,比如CC或者Codex等,然后就自动的有产品经理,代码编写等各种Agents来帮我开发这类东西。
然后做到现在,其实有一些很严重的问题,和我自己曾经的一些开发AI产品的经验也有点关系,现在来说说。
OpenClaw以及多Agents开发面临的难题
1.Agents之间的沟通信息传递准确率非常低,包括人和Agent之间
就和人和人之间的沟通也是有效率和信息差的问题,Ags(Agent简写 后面一样 Ags表示Agents复数 Ag表示Agent)之间也是这样。如果我们想让Agents模仿一个Saas团队那样去搞什么产品经理,测试之类的岗位,那么需要一个很强大的协调AI(暂称总监Ag)。
这个总监Ag要做的事情不只是说任务派发这么简单的事情,更重要的是确认一个个小的目标的落实。比如说对后端Ag和前端Ag的沟通,派任务,但是仍然要监督他们做的内容,而这个东西其实也不能简单的交给一个测试Ag,因为可能测试Ag自己都不知道总监Ag想要的是什么。
以开发一个聊天工具为例
我曾经想让OpenClaw帮我利用好Codex这个工具来开发一些中小型的项目,比如说一个聊天软件,我已经给了他内网服务器等工具,但是最后他一直在摸鱼,最后连部署都在我推着他走才行。最后也不是我想要的东西,他就随便搞了个ui网页忽悠我,完全没实用功能。
还有一个例子是,我用OpenCode想打造一个我刚刚说的那种思路的Agents工具,并且这个工具在论坛中是有相关的佬在开发的,但是我让OpenCode拉项目fork之后,继续开发,然后我让他开发一个小游戏来验证这个Agents工具是否可行,后面发现他直接自己手搓了,而不是用他开发的这个工具…
2.记忆仍然不够强大
先用我们人的生活习惯来说,比如我们起床就刷牙,洗脸,吃早饭之类的,并不是说我们记得要刷牙,然后才去刷牙。而对AI来说,我们做很多事情,其实都是要依靠记忆系统和上下文。但是记忆系统再强大,也是有限的。
我们并不能通过塞大量的说明书一样的东西来让AI变的全知全能。并不是有个Skills他就能完全胜任一些复杂的工作了,尤其是像cc这类工具,目前来看更不是说几个Skills就能完全替代了,目前像OpenClaw这样的工具,仍然无法做中型以上的复杂工程。专业的事情仍然得交给专业代工具。
即使我们已经给OpenClaw这类提供一些很强大的记忆系统,但是仍然不能把他变成一个全能的AI,而只能让他专门的用在特定的领域。如果想要他变成一个管家级别的Ag,那就会变成我刚刚上面说的,因为Ag之间信息传输准确性的问题。以质至于管家Ag手下都是一堆摸鱼的AI。
而记忆系统也是要专门特化的,而不是说AI可以自己开发的很好的,这些需要人去测试,然后提供足够的反馈来给AI修复的。说到这,就想引出第三个话题
3.AI做不了一个很好的监工
我去年在游戏公司做NPCAI的时候,想用AI判官的方式来判断AI为NPC生成的内容是否合法,但是实践证明,一个是AI判官即使是知道规则,但是就像人改语文试卷一样,主观因素很大,但是AI就是个黑盒,对于一些文案类的东西更是乱判。
比如一些NPC是豪放的性格,说的内容可能不够豪放,但是这个“不够豪放”可能是一个非文案策划都难以看的出来的,类似的还有很多,也就是说对于一些人都有点难判断的东西,llm判断的水平更是不行。
再比如让AI开发一个ui界面,除非主动加识图,否则只能用html之类的方式知道各节点的东西。但是实际上仍然不够,因为一个ui舒服不舒服,是否符合用户逻辑,这点目前我的测试AI是不知道的,他只知道功能堆砌。也就是说我们都不用说UI好看不好看这类很主观的东西了,就只是说是否符合用户逻辑,这点也很难判断。当然这也是一个合格的产品经理或者游戏策划才能感受到的东西。
总结
这波因为OpenClaw之类的东西,让普通人可以进一步的使用到更好的AI产品(很多普通人可能之前只能局限在豆包之类的对话应用)。而现在由于大量大厂的跟进,现在也逐步优化了一些好工具,各种龙虾也会出来。
不过,对于一些中大型项目的开发,仍然是有很多的AI相关的难题要解决。不过现在程序员的门槛是降低了,只要懂一点开发,或者愿意去了解一些**专业知识(只需要了解)**就可以开发出很多非常有经验的程序员才能开发的东西了。
所以属于是。下限提高了,因为普通人也在接触这些东西了,大量的初级程序员也因此收益。