每日摘要
- 来源:群聊与 Chrome/Claude/Codex 浏览器控制工具
- 一句话:记录了让 Claude/Codex 接管浏览器的工具与初步体验,包括日历操作、登录状态和真实浏览器窗口执行的问题。
- 我的判断:浏览器自动化很有潜力,但上下文、登录态和提示词边界仍需要设计,否则容易出现“能打开页面但接不上已有状态”的问题。
- 关键词:浏览器自动化、Claude、Codex、Chrome、AI Agent
原始记录
让 Claude/Codex 接管浏览器?
Google Chrome 团队刚发布了一个官方工具,能让 Claude/Codex 直接接管你正在用的浏览器。
Notion 同步飞书、整理 GitHub star、查 Analytics 数据、删 Twitter 帖子……这些操作在你眼前的真实浏览器窗口里实时发生。
…
现在你日常 80% 的浏览器重复操作,其实都可以扔给 AI 了。
水群时看到一个工具。Gooogle官方说明应该是这个 ,最新发布时间2025-12-16。
- Chrome 地址栏输入:
chrome://inspect/ #remote -debugging。勾选 Allow remote debugging。 - 添加
chrome-devtools工具到 Claude Code/Codex
|
|
- 重启 Claude Code/Codex,下达指令。 第一次使用可以用下面的命令测试。浏览器会有一个弹窗提醒。
|
|
|
|
提示词有一些不足,实际上我提前打开了 google 日历,并不需要它自己打开。实测效果是它自己打开的并没有我的登录信息,最后还是用我打开的页面执行了后续操作。
于是我让 CC 帮我去除一些无关项,合并同类项,并且让它给我生成一个 md 表格。到这一步为止还挺顺利。
进一步地,我想试试 CC 对网页的实际操作能力,于是我让它在我的日历中将合并项的名字修改。可以看到 CC 在调用各种工具,click、take_snapshot、 press_key、fill、evaluate_script。但最后并没有成功执行任务。
和 C 老师交流了一下,它给出的结论是:Google Calendar 的前端框架阻止了直接修改 DOM 的方式生效()。解决方法是需要用模拟真实键盘输入来替代直接赋值。
|
|
用到的工具
|
|
改三个活动就花了几分钟,token 也花的很快。是太夸张了。