OpenClaw怎么识别图片?OpenClaw识别图片提取文字的教程

如何让小龙虾识别图片,批改作业 ,按照下面布置来设置

第一步:使用 models status 查看当前配置

在执行任何修改前,建议先运行以下命令,了解当前的图片模型设置和认证状态:

注意:openclaw models status 命令需要 Node.js v22.12+,当前环境 Node 版本不匹配。如需查看详细模型列表,可能需要升级 Node 版本。

openclaw models status

这个命令会显示已解析的主要模型、回退模型以及专门用于视觉任务的 imageModel 配置 。它还能显示已配置提供商的认证概览,比如OAuth是否过期、API密钥是否缺失等 。如果你想只看精简后的主要模型,可以加上 --plain 选项。

没配置图片模型是识别不了图片的 查询结果是这样的

第二步:使用正确的命令修改图片模型

修改图片模型需要使用专门的CLI命令,而不是 status

  • 设置主要的图片模型:
    使用 openclaw models set-image 命令,后面跟上你想使用的视觉模型ID。bash# 格式: openclaw models set-image / openclaw models set-image moonshot/kimi-k2.5
    • 条命令会将 agents.defaults.imageModel.primary 设置为指定的多模态模型 。
    • 管理图片模型的备用方案(回退链):
      为了确保在处理图片任务时有更高的成功率,你还可以为 imageModel 配置一个备用模型列表。bash# 列出当前的图片模型回退链 openclaw models image-fallbacks list # 向回退链中添加一个模型 openclaw models image-fallbacks add openrouter/google/gemini-2.0-flash-vision:free # 移除回退链中的一个模型 openclaw models image-fallbacks remove openrouter/qwen/qwen-2.5-vl-72b-instruct:free通过设置回退,当主要图片模型不可用时,OpenClaw会自动尝试列表中的下一个模型 。

修改完成后,可以再次运行 openclaw models status 来验证你的设置是否已生效。此时,输出信息中的 imageModel 部分应该已经更新为你刚才配置的模型。

此外,如果你想更深入地检查配置是否真的能工作,可以在 status 命令后加上 --probe 标志。这会对每个已配置的提供商进行实时认证探测,确保你的API密钥等凭证是有效的 。

:light_bulb: 额外提示:手动编辑配置文件

除了使用CLI命令,你也可以直接编辑OpenClaw的配置文件(通常位于 ~/.openclaw/openclaw.json)来修改 imageModel 。配置结构大致如下:

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "minimax-portal/MiniMax-M2.5-highspeed"
      },
      "imageModel": {
        "primary": "moonshot/kimi-k2.5",
        "fallbacks": ["openrouter/google/gemini-2.0-flash-vision:free"]
      }
    }
  }
}

编辑保存后,需要重启OpenClaw网关服务使配置生效:openclaw gateway restart

再次收入命令 openclaw models status 验证 下面是我电脑配置后的效果

到这已经配置好了,看下 效果

这个方法有点秒。