Codex 新增的 Chrome 插件有点猛,可以后台控制 Chromium 系浏览器了

今天更新了一下 Codex ,发现它现在多了一个内置的 Google Chrome 插件,可以直接控制浏览器执行任务。

我试了一下,体验比预期强不少。它不是简单地“帮你点网页”,而是可以在后台跨浏览器页面工作,不影响你正常使用浏览器。也就是说,你可以继续用自己的浏览器做事,同时让 Codex 在另一个页面里跑任务。

更有意思的是,它还支持并行。比如可以启动多个 SubAgent ,让它们分别操作不同网页,相当于同时开几条浏览器任务线。

我目前发现最厉害的一点是:它不只支持 Chrome ,任何基于 Chromium 的浏览器好像都可以。

大概使用流程是:

在 Codex 插件库里找到 Chrome 插件
点击添加
它会引导你打开浏览器插件安装页面
打开页面并安装插件
安装完成后,就可以直接让 Codex 操作浏览器了
这类能力之前也不是完全没有,但 Codex 这个实现比较爽的地方在于:支持并发,而且不影响用户原生操作。你不用把自己的浏览器控制权完全交出去,也不用盯着它一步步点。

另外看说明 Mac 和 Windows 都支持。

感觉这会让很多网页类任务变得很顺,比如:

批量查资料
填一些重复表单
对比多个网页信息
后台跑网页测试
多账号/多页面并行处理
目前还只是简单试了下,稳定性和边界还没细测,但这个方向挺有想象空间的。

这玩意儿不就是以前按键精灵的网页版吗?没啥新鲜的。

小白问一下,这个插件是不是需要给Codex很高的权限才能控制浏览器啊?我有点担心安全问题,不太确定要不要试。

又来了,每个工具刚出来都吹得天花乱坠,等用两天发现一堆bug和限制,就开始骂街了。还“有点猛”,我看是“有点懵”吧。

楼主提到可以后台跑网页测试,我对这个特别感兴趣!能不能展开说说具体怎么操作?比如我想测试一个网页在不同登录状态下的展示,是不是可以让Codex开两个隐身窗口,分别用不同账号登录然后执行相同的点击流程?还有,它怎么判断页面加载完成了没有,是等固定时间还是检测某个元素出现?如果页面弹出了非预期的模态框,它有处理机制吗?希望有详细点的教程。

听起来很猛但安全风险也不小

我也试了,它能识别表单字段填的,比按键精灵强

权限是大问题,至少得关键操作弹确认

同担心权限放开太彻底等于把饭碗交给AI了

后台控制Chromium这操作太敏感了,企业用得做隔离

权限的确给得有点多,先开个独立浏览器配置文件试比较稳

浏览器自动化能做的事不少

权限管控确实是问题,给浏览器root权限风险大

按键精灵那个对比有点low了,这个起码懂上下文

说像按键精灵也太贬低了,能理解页面语义和DOM这事按键精灵做不到