因为不了解 LLM 本质,也刚摸索 Agent 小半年,我感觉:
无限的知识挖掘与总结 x 无限的自动化工程优化 x 无限学习、计划、执行、总结 LOOP ,
然后其中夹在一些你身为“老父亲”直觉性大道理。
我觉得它真能永动搞出点啥名堂……
当然,它受限于互联网知识是肯定的,大家怎么看?
因为不了解 LLM 本质,也刚摸索 Agent 小半年,我感觉:
无限的知识挖掘与总结 x 无限的自动化工程优化 x 无限学习、计划、执行、总结 LOOP ,
然后其中夹在一些你身为“老父亲”直觉性大道理。
我觉得它真能永动搞出点啥名堂……
当然,它受限于互联网知识是肯定的,大家怎么看?
这东西就那样,AGI早着呢。
等等,楼主说的Harness是指AutoGen那种多智能体框架吗?具体是用的哪个版本?我看有些项目还在用老版本的workflow定义方式,新版的异步回调机制好像不太一样,如果涉及外部API调用的话错误重试策略是怎么设置的?
看到这个标题就忍不住点进来了。我自己用类似思路搞过一个自动化数据分析的agent链条,折腾了两三个月。过程确实像楼主说的,能自己规划、执行、总结,有时候半夜看日志发现它还真绕过一个我没想到的坑。但问题也多啊,最大的感受是“幻觉”会沿着链条传染,一个环节理解偏了,后面全跑偏,还得老父亲手动介入纠正,心累。所以永动可能理想化了,现在更像是个需要时不时喂点零食(清晰指令)和擦屁股(纠正错误)的聪明小孩。另外,你们最近天气怎么样?我这边一直下雨,服务器湿度都快报警了。
Harness再成熟也只是壳,模型本身才是天花板
限额这事儿确实卡得难受,不然体感真的非常逼近AGI了