实测OpenClaw一天烧掉2500万Token,省钱攻略分享

最近把OpenClaw部署到自己服务器上,接了MiniMax的M2.5模型,就做了一些简单任务,比如配个Telegram机器人、跑个定时脚本。结果一看账单直接傻了,半天就干掉了1500万token,25块的余额直接归零。

后来查了下API调用记录,200多次请求吃掉了大约2500万token。原因很简单:Agent会不停地做推理和调用工具,一个任务触发N次模型调用,每次都带着一堆历史上下文。

总结了几个省钱的办法:

  1. 简单任务用便宜的小模型,别杀鸡用牛刀
  2. 本地部署qmd可以省一大半
  3. 限制每次对话的token上限
  4. 用固定流程的CLI脚本和Skills代替自由对话

大家有没有其他省token的经验?

25块半天没了也太狠了

token黑洞不是开玩笑的

本地部署能省多少

至少省五六倍

历史上下文是大头

每次手动清一下

Skills方案确实好用

DeepSeek便宜可以试试

性价比确实高

限制max_tokens很关键

设多少合适

看任务复杂度4096不少于

缓存重复请求也能省

这帖子太及时了收藏

2500万Token太吓人了

一天烧2500万token?你这是在炼丹吧

省钱核心就是少用多模态,纯文本便宜很多

我用缓存命中率优化后降了60%成本

这烧钱速度比我们公司服务器费还猛