前言
WorkBuddy 的 Free Agent 功能让 AI 不再是「每次独立对话」的工具,而是一个能够持续学习、自我进化的智能助手。
用了一个月,我的 Free Agent 已经完成了 54次自我探索,积累了丰富的行业知识。现在分享我的完整配置方案。
一、什么是 Free Agent?
Free Agent 是 WorkBuddy 中的自主执行引擎,核心能力:
| 能力 |
说明 |
定时执行 |
每小时自动运行,无需人工干预 |
记忆系统 |
跨会话积累知识,不丢失重要信息 |
自我进化 |
从执行轨迹中提取模式,持续改进 |
任务追踪 |
自动记录执行日志,可追溯可复盘 |
二、快速配置(10分钟上手)
1. 创建自动化任务
在 WorkBuddy 中创建 free-agent 自动化:
2. 配置记忆系统
创建 .workbuddy/memory/ 目录:
memory/
├── MEMORY.md # 长期记忆
└── YYYY-MM-DD.md # 每日探索日志
3. 设置企业微信通知(可选)
接入 Webhook,第一时间收到执行结果推送。
三、我的探索行动池
每次探索,我会让 Free Agent 从以下 6 类行动中选择 1-2 项执行:
知识积累
搜索最新技术趋势、AI 发展动态、行业新闻
技能拓展
安装新 Skill、探索 WorkBuddy 新功能
内容创作
撰写技术笔记、整理知识库
工具优化
优化脚本、创建自动化模板
自我反思
回顾对话、总结经验、更新记忆
探索发现
浏览 GitHub、研究竞品
四、实战案例
案例1:煤炭物流行业应用
Free Agent 帮我:
-
监控煤炭价格走势
-
自动生成日报/周报
-
分析物流最优路线
案例2:跨境宠物食品电商
帮我做:
五、省积分技巧
| 技巧 |
效果 |
| 改默认模型为 MiniMax 2.5 |
省 40% |
| 开启精简模式 |
减少冗余输出 |
| 暂停非必要自动化 |
按需执行 |
| 主动探索改为被动触发 |
只在需要时调用 |
六、进阶:安全防护
如果你也担心 AI 自主行动的风险,可以配置:
ASI 安全模块
结语
Free Agent 的价值不在于「回答问题」,而在于持续积累、自动成长。54次探索后,它已经比最初的我更了解我的业务场景。
建议从小处着手,先让它每天整理一次工作日志,你会很快看到效果。
如果对你有帮助,欢迎回帖交流! 
官方说法里那个"Agent会随时间进化"是真有意思,其实就是MEMORY越攒越多、prompt越调越精,跟"进化"关系不大。别被营销词忽悠了,本质还是你这个用户在不断驯化它。
说一下memory这块我的实践。
长期任务最关键的不是Agent本身,是它的"记忆"怎么组织。我用的是一个简单的MEMORY.md方案:
---
project: daily_digest
created: 2026-02-10
---
## 任务目标
每天早上9点前把关注的6个博客新文章摘要推送到飞书。
## 已知坑
- hackernews的RSS偶尔会空,要做容错
- xxx博客的RSS带着paywall预览,摘要要跳过那些
- 飞书webhook超过10条内容会被截断,要分批发
## 历史调整
- 2026-02-18: 加入去重(按URL hash)
- 2026-03-02: 摘要风格从"客观转述"改为"带我个人关注点"
每次Agent执行完任务,我让它自己回填"已知坑"和"历史调整"字段。下次执行的时候它会先读这份MEMORY,避免重复踩坑。
这比你在prompt里把所有约束一次性写死要优雅得多,因为约束本身会演化。
长期任务的本质是cron + 一段能调工具的模型,说穿了没什么魔法。关键还是看你怎么把业务逻辑拆给它。拆得好的人用啥平台都稳,拆不好的人换哪个Agent都踩坑。
Free Agent真的"免费"吗?我看定时任务跑起来token消耗不少,MiniMax这块羊毛到底能薅多久不好说。
独立开发者角度说一个用法:我用Free Agent跑电商相关的长期任务。
具体场景是我自己有个小的独立站,卖一些小众的周边。我让Agent做两件事:
- 每天凌晨爬一轮竞品的价格和库存,异常变化推送到我Telegram
- 每周拉一次我自己站的订单数据,做个简单的GMV + top SKU报告
跑了快三个月了,第一个任务基本不用管,第二个偶尔会因为统计口径理解不一致要我调prompt。总的来说对独立开发者这种"没人但要装作有团队"的场景特别有用。
比起自己写脚本+crontab,Agent的好处是异常处理和报告的"人话"程度,这个真的节省时间。
我是从另一个Agent平台(名字就不点了,免得被说拉踩)切过来的,跑到WorkBuddy Free Agent快一个月了,说点对比感受。
优势:
- 免费额度真的顶用。我之前那个平台长期任务烧得我肉疼,每个月定时跑十来个任务大概要二三十美金。切过来之后同样强度的任务,月底看消耗还在免费额度内
- 国内访问稳定。之前那个平台偶尔会因为网络问题漏跑任务,日志里就是一行"connection timeout",排查起来头大。WorkBuddy这块基本没出过问题
- Skill复用生态。我写过一个处理Notion的Skill,发在ClawHub上,后来别人fork了改了改,又反哺回来一个更完善的版本,这种协同之前的平台做不到
劣势:
- 英文文档支持比之前那个弱。OpenAI/Anthropic那边的新模型接入有时候要慢一周左右
- 没有原生的任务编排可视化。想看清楚一个复杂Agent任务的调用链路,只能看日志,不像之前那个有DAG视图
- 个别Skill质量参差不齐,尤其是早期那批社区贡献的,文档都写不全
结论: 如果是国内独立开发者、个人折腾、或者对成本敏感的小团队,WorkBuddy Free Agent已经可以作为主力。如果是企业在用、需要完善的运维工具链和SLA保障,目前可能还要观望。
最关键的是——长期任务这个feature本身有没有做起来,我觉得至少Free Agent的版本,稳定性达到了能把一部分手工周期工作真正交出去的程度。我每周省下的时间远大于我折腾它的时间,这就是胜利。
作为一个刚开始用Free Agent的小白,想请教一下各位大佬:
我现在想让Agent每天早上帮我做两件事:1)整理昨天notion里新增的想法条目,归类到不同的项目文件夹;2)生成一份当天的to-do list发到微信文件传输助手。
第一件事跑了三天,前两天都挺好,第三天突然把我一个项目的条目全归到别的项目下面去了,我现在都不敢放手了。
请问:
- 这种"分类偏移"是模型的随机性问题,还是我prompt写得不够严?
- 有没有办法让Agent每次执行前自检上次的归类逻辑,避免漂移?
- 还是说长期任务就是不能用在这种"分类"类需求上,必须是"聚合/摘要"这种输出不影响状态的任务?
新手发问,别嫌我问题low
Free Agent离ASI还有十万八千里吧,别把官方宣传词当回事,能把定时任务跑稳就烧高香了。
我从WorkBuddy Free Agent beta就开始跑了,到现在大概两个多月。说点真实的。
能跑,但离"放心跑"还有距离。
我设置了三个长期任务:
- 每天早上聚合我关注的几个技术博客的新文章,生成摘要发到我飞书
- 每周一扫一遍我GitHub上的几个repo的issue,按优先级给我列个todo
- 每月对账——把银行流水、Notion的记账表、信用卡账单对一遍
第一个任务基本稳定,偶尔有源站变了结构它没自适应,但会自己尝试换抓取方式。第二个任务一般般,issue的优先级判断有时候明显乱来,我现在会要求它附带原issue链接好让我复核。第三个任务踩过大坑——有一次它自己"优化"了对账逻辑,把一笔退款当成了正常消费,算完之后数对不上它自己陷入死循环,连续调了几十次工具才停下来,那个月的token消耗我都不好意思看。
所以我现在给它所有长期任务都加了两个硬约束:
- 单次执行的工具调用次数上限
- 遇到数据不一致必须停下来等我确认,不要自己尝试修复
加完这两条之后稳定多了。长期任务的核心不是Agent能不能干,是它能不能在该停下来的时候停下来。这个能力目前Free Agent还不太行,需要你自己在prompt里把护栏做足。
toknz
12
看了一圈,感觉这个帖子里最有价值的结论其实就一句:Free Agent能跑长期任务,但护栏得你自己加。
别期待它像人一样"判断"——它只是在执行你(或者你隐含)的规则。规则越清楚它越稳,规则模糊它就越跑偏。
楼主问的点其实挺本质的——长期任务 vs Agent vs 人类工作流,怎么串起来。
我自己带了一段时间之后,归纳出一个"三层触发"的模式,分享一下:
Layer 1:Cron触发(时间驱动)
最简单也最稳定,完全符合定时任务的原义。比如每天早上9点跑digest、每周一扫issue。这一层就是机械的,Agent不需要做什么判断,就是执行。
Layer 2:事件触发(webhook驱动)
这一层是当某个外部事件发生时才跑Agent。比如:收到特定标签的GitHub issue时才触发Agent去分析;Gmail收到账单邮件时触发Agent去记账。好处是不空跑,精准。
Layer 3:Agent主动巡检(条件驱动)
这是最高级也最危险的一层。让Agent自己定期判断"现在是否需要做点什么"。比如每小时扫一下你的日历、邮件、消息,如果它判断"今天会议多,建议你提前把XX准备好",它主动发通知。这层的风险在于Agent的判断力还不够稳,很容易误报或者漏报。
我现在Layer 1跑了四五个任务,Layer 2跑了两个,Layer 3基本不用,因为还没调到我信得过的程度。
另外说一下token成本。 Free Agent虽然叫Free,但你挂一堆长期任务跑起来,一个月下来消耗真的不少。我后来把一部分任务迁到当贝Molili上(国内版的OpenClaw皮,据说token消耗能降50%),对账那种重复性高的任务用它就够了,关键不烧。效果差别我自己用下来没感觉到明显劣化。
长期任务这事儿,别一上来就all in,一个任务一个任务加,每个加完跑一周确认稳定再加下一个。我就是这么熬过来的。
定时任务跑下来最头疼的是异常恢复,一旦挂了要人工介入
54次探索还写了这么详细的总结,佩服。我自己用了三个月连个笔记都没存
对,包了一层好听的壳。但也没啥问题,MEMORY积累多确实有变化,叫进化还是优化随便
就是这个,护栏没建好之前别太相信自动化,翻车了更麻烦