OpenClaw的上下文窗口到底够不够用?做了个极限测试

很多人关心OpenClaw的上下文窗口能处理多大的输入。我做了一系列测试,结论可能出乎你意料。

测试环境

  • OpenClaw最新版
  • 底层模型:分别测试Claude 3.5/GPT-4/千问2.5
  • 测试内容:代码文件、文档、对话

测试结果

代码分析场景

代码量 Claude 3.5 GPT-4 千问2.5
1000行 流畅 流畅 流畅
5000行 流畅 流畅 偶尔丢失
10000行 偶尔丢失 流畅 丢失明显
20000行 丢失明显 偶尔丢失 不可用

长文档处理

把一本10万字的技术文档喂进去:

  • Claude直接处理到8万字左右开始丢信息
  • GPT-4大约6万字
  • 千问约3万字

长对话

连续对话100轮以上,所有模型都会出现"忘记"前面说过的内容的情况。

OpenClaw的优化策略

OpenClaw本身做了一些优化来缓解上下文限制:

  1. 自动摘要:长对话会自动压缩历史
  2. 记忆文件:重要信息持久化到本地
  3. 分块处理:大文件自动分块分析
  4. RAG增强:结合向量检索扩展"记忆"

实用建议

  1. 单次不要喂太多内容,分批处理
  2. 重要上下文放在对话开头
  3. 善用记忆功能保存关键信息
  4. 大项目用RAG而不是直接塞上下文

上下文窗口是当前AI的硬性限制,但通过合理的工程手段可以很好地绕过。

2 个赞

上下文限制确实是目前AI最大瓶颈

1 个赞

Claude长文本能力明显领先

1 个赞

善用记忆功能可以绕过大部分限制

1 个赞

@suanfa_daren 千问长文本也还行吧

2 个赞

@suanfa_daren Claude长文本确实领先 但200K token的窗口实际可用容量大约是输入150K+输出50K 不是全部都能用来输入

@zhaoyi_ml 记忆功能绕过限制是目前最实用的方案 但会丢失细节 适合需要大方向不需要精确细节的场景

非root用户运行容器是基本功

自动化之后领导以为我每天加班写的哈哈

日报模板固定的话用Jinja2渲染更快

我用cron+OpenClaw每天自动生成日报推到飞书