在使用 OpenClaw 进行浏览器自动化的过程中,我发现内置的浏览器控制存在两个主要问题:
-
会话持久化不佳:浏览器状态在命令之间经常丢失,需要重新导航和认证
-
性能表现欠佳:执行效率不够理想,影响自动化工作流的速度
解决方案
Chrome 浏览器本身就提供了官方的 DevTools Protocol(CDP),这是一个久经考验的浏览器控制协议。同时,社区已经有了优秀的 MCP 服务器实现(chrome-devtools-mcp),可以将 CDP 与模型上下文协议(Model Context Protocol)桥接起来。
与其重新发明轮子,不如直接利用这些成熟的工具。
为什么选择 CLI?
CLI 工具是 OpenClaw 生态系统中的一等公民。AI 助手可以可靠地调用 CLI 命令,解析输出,并将它们串联起来完成复杂的工作流。通过将 Chrome DevTools Protocol 封装为 CLI 接口,我们获得了:
持久化会话:浏览器在命令之间保持打开,维护状态、Cookie 和认证信息
更好的性能:直接 CDP 通信比其他浏览器控制方法更快
更高的可靠性:使用 Chrome 官方协议意味着更好的稳定性
灵活性:既可以独立使用,也可以通过 AI 助手使用
生态集成:无缝融入 OpenClaw 技能系统
主要功能
-
浏览器导航和多标签页管理
-
截图和 DOM 快照
-
元素交互(点击、悬停、填充表单)
-
网络请求监控
-
控制台日志捕获
-
JavaScript 执行
项目地址: GitHub - finas/browser-cli: Browser automation skill and cli for openclaw · GitHub
欢迎试用并提供反馈!