开源推荐

其他

36个平台103条命令，bb-browser让AI Agent直接用你的浏览器登录态

发表于 2026年03月31日阅读 14 评论 0

大家好，我是何三，独立开发者

bb-browser

你有没有想过一个问题：AI Agent 能读文件、能执行终端命令、能调一堆 API，但它没法像你一样"逛"网页。

你随手打开知乎刷个热榜，一分钟搞定的事，对 Agent 来说几乎不可能——因为知乎没有 API，你的登录态它拿不到，Cookie 提取又面临反爬。Twitter、微博、小红书、B站、BOSS 直聘……全一样。

99% 的网站压根不提供机器接口。AI Agent 的世界被锁死在"文件系统 + 终端 + 几个有 API key 的服务"里。

最近 GitHub 上有个叫 bb-browser 的项目（3.3k Star），干了一件很"坏"的事——

把你的浏览器直接变成 API。

bb-browser

核心思路：不是模拟，是"就是"

传统思路是让 AI 去模拟浏览器操作。Playwright、Selenium、各种爬虫库，本质上都在干同一件事：伪装成一个浏览器。

bb-browser 不这么干。

它的做法是：直接在你的 Chrome 里跑代码。通过 Chrome 扩展 + CDP（Chrome DevTools Protocol），Agent 可以在你已打开的标签页里执行 eval、调 fetch、甚至注入 webpack 模块。

网站看到的 Cookie、Session、Token 全都是你自己的。它没办法区分这是你点的还是 Agent 操作的。因为这确实就是你的浏览器。

bb-browser

这跟"无头浏览器模拟登录"有本质区别。无头浏览器再怎么伪装，指纹、行为模式、WebSocket 握手这些地方总会露出马脚。而 bb-browser 根本不存在这个问题——它不是在"模拟"你，它就是你在操作。

36 个平台，103 条命令

bb-browser 把这个思路做成了一个社区驱动的适配器体系。每个网站的适配就是一个 JS 文件，放在 bb-sites 仓库里。

目前覆盖了 36 个平台、103 条命令：

类别	平台
搜索引擎	Google、百度、Bing、DuckDuckGo、搜狗微信
社交媒体	Twitter/X、Reddit、微博、小红书、即刻、LinkedIn、虎扑
新闻资讯	BBC、Reuters、36氪、今日头条、东方财富
技术开发	GitHub、StackOverflow、HackerNews、CSDN、npm、PyPI、arXiv
视频平台	YouTube、B站（9个适配器）
影音娱乐	豆瓣、IMDb、起点中文网
财经股票	雪球、东方财富、Yahoo Finance
求职招聘	BOSS直聘、LinkedIn
知识百科	Wikipedia、知乎、Open Library

一些实用场景：

# 跨平台调研一个话题
bb-browser site arxiv/search "retrieval augmented generation"
bb-browser site twitter/search "RAG"
bb-browser site github search rag-framework
bb-browser site stackoverflow/search "RAG implementation"
bb-browser site zhihu/search "RAG"

# 日常使用
bb-browser site weibo/hot              # 微博热搜
bb-browser site eastmoney/stock "茅台"  # 实时股价
bb-browser site boss/search "AI工程师"  # 搜职位
bb-browser site douban/top250            # 豆瓣电影 Top250
bb-browser site bilibili/trending        # B站热门

还能配合 --jq 做数据过滤：

bb-browser site xueqiu/hot-stock 5 --jq '.items[] | {name, changePercent}'
# {"name":"云天化","changePercent":"2.08%"}
# {"name":"东芯股份","changePercent":"-7.60%"}

架构：四层，很清晰

整个系统分四层，结构简单到有点粗暴：

AI Agent (Claude Code / Codex / Cursor)
│ CLI 或 MCP (stdio)
▼
bb-browser CLI ──HTTP──▶ Daemon ──SSE──▶ Chrome 扩展
│
▼ chrome.debugger (CDP)
你的真实浏览器

bb-browser

AI Agent 通过 CLI 或 MCP 协议下发命令；bb-browser CLI 解析命令，找到对应的适配器；Daemon 是本地后台服务，默认监听 localhost:19824；Chrome 扩展 通过 CDP 协议在你的浏览器里执行实际操作。

整个过程不需要任何 API Key。你只需要登录过那个网站，剩下的全交给 bb-browser。

三种接入方式

方式一：OpenClaw（最省事）

如果你用 OpenClaw，直接通过它内置浏览器运行，不用装扩展、不用启 daemon：

bb-browser site reddit/hot --openclaw

方式二：Chrome 扩展（独立模式）

从 Releases 下载 zip，解压后在 Chrome 扩展页面"加载已解压的扩展程序"即可。

方式三：MCP 接入 Claude Code / Cursor

在 MCP 配置里加一段就完事：

{
  "mcpServers": {
    "bb-browser": {
      "command": "npx",
      "args": ["-y", "bb-browser", "--mcp"]
    }
  }
}

配完之后，Claude Code 里就能直接调用浏览器了。

适配器分三档，最快 1 分钟

写一个新网站的适配器，难度分三档：

层级	认证方式	代表网站	耗时
Tier 1	Cookie 直接 fetch	Reddit、GitHub、V2EX	~1 分钟
Tier 2	Bearer + CSRF token	Twitter、知乎	~3 分钟
Tier 3	Webpack 注入 / Pinia store	Twitter 搜索、小红书	~10 分钟

有意思的是，bb-browser 团队做过一个测试：20 个 AI Agent 并发运行，每个独立逆向一个网站并产出可用的适配器。

换句话说，让 Claude Code 读一遍 guide，然后让它自己去 network --with-body 抓包、写适配器、测试、提 PR——全程自动。把一个新网站接入 Agent 世界的边际成本，基本趋近于零。

这其实是一个很有想象力的方向。当"给网站写 CLI 适配器"这件事本身可以被 AI Agent 自动完成，那覆盖整个互联网只是时间问题。

也是一个完整的浏览器自动化工具

除了 site 命令，bb-browser 本身也支持完整的浏览器操作：

bb-browser open https://example.com
bb-browser snapshot -i          # 可访问性树
bb-browser click @3             # 点击元素
bb-browser fill @5 "hello"      # 填写输入框
bb-browser eval "document.title"  # 执行 JS
bb-browser fetch URL --json     # 带登录态的 fetch
bb-browser network requests --with-body --json  # 抓包
bb-browser screenshot           # 截图

支持 --json 输出、--jq 过滤、--tab 多标签页并发。不只是一个"让 AI 能上网"的工具，也可以当浏览器自动化框架来用。

我的看法

bb-browser 解决的不是一个新问题，但它用了最直接的方式去解决。

之前也有人做"浏览器自动化给 AI 用"的产品，但大多数走的是"建一个云端浏览器池"的路线——成本高、延迟大、用户还不放心自己的登录态交给第三方。

bb-browser 选了一条完全不同的路：不碰你的数据，不存你的 Cookie，一切都在你本地浏览器里发生。 它只是一个"管道"，让 AI Agent 的指令能到达你的浏览器。

当然，这个项目也还比较早期。适配器质量参差不齐，部分平台的适配可能因为网站改版而失效。但社区驱动 + AI Agent 自动生成适配器的模式，让它扩展速度会非常快。

如果你是 Claude Code、Cursor 的重度用户，或者在做 AI Agent 相关的开发，bb-browser 值得试试。

项目地址： https://github.com/epiral/bb-browser

本文使用 MGO 编辑并发布
关注"何三笔记"，回复"mgo" 免费下载使用

版权声明：如无特殊说明，文章均为何三笔记原创，转载请注明出处

本文链接：https://www.h3blog.com/article/734/

核心思路：不是模拟，是"就是"
36 个平台，103 条命令
架构：四层，很清晰
三种接入方式
适配器分三档，最快 1 分钟
也是一个完整的浏览器自动化工具
我的看法