别让模型烧Token了!GitHub 20k星神作:把全网变成命令行

Reddit讨论、B站热门、Arxiv论文,以前开浏览器一个个翻的东西,现在终端一行命令直接出结构化数据。

而且不只是网页,现在OpenCLI连微信、Telegram、Discord这些私域聊天记录都给打通了。

所以,只要把配套的skill装进Agent,管你什么公域私域、网站还是App,基本都能通过命令直接在终端里调。

意思就是很多原本需要Agent“边看边点”的操作,现在浏览器自己就能干,跑多少次都不花一分钱Token。

不需要手动配置cookie,OpenCLI就能直接复用你Chrome的登录态,你在浏览器里已经登录的站,它都能直接用。

至少不用再自己复制cookie、手搓请求头、把凭证硬编码进脚本里了,也相对安全一些。

首次使用需要wx init初始化,它会自动检测微信数据目录,然后从微信进程内存里扫描数据库密钥。

这个过程需要root权限(macOS上用sudo wx init),而且微信必须处于登录状态。

聊天记录这东西,本来只是散落在各个App里的碎片信息,但被CLI统一接管之后,它突然开始变得可搜索、可筛选、可导出、可自动化处理。

输出格式支持JSON和CSV,直接灌进知识库或者数据分析流程里,跟Obsidian这类工具接上也顺理成章。

甚至可以说,这会让Agent真正开始具备持续读取你真实数字生活里的最新信息的能力。

里面有你的工作流、关系链、协作历史、长期偏好,甚至还有大量AI以前根本碰不到的“隐性知识”。

除了社交,办公场景也没落下,给它们做了统一接口,opencli lark-cli覆盖飞书200多条命令,消息、文档、日历、任务全拿;

opencli wecom-cli管企业微信,opencli dws管钉钉,主打一个办公全家桶。

客服聊天记录一键导出,用户反馈批量归档,以前得手动截图复制粘贴的活儿,现在一行命令搞定。

OpenCLI作为开源项目提供的是工具和思路,私域数据的实际访问和部署属于个人行为,用之前务必仔细评估合规风险和隐私边界。

OpenCLI跟“让大模型自己操作浏览器”最大的区别在于CLI命令是在本地浏览器里直接执行的,不经过大模型推理,意思是如果不分析结果,运行时就零Token消耗

而且因为是确定性命令,同一个命令跑出来的结果结构是一致的,可管道、可脚本、CI/CD友好。

某种意义上,它是在把浏览器自动化从AI推理重新拉回系统调用,Agent也开始有点软件基础设施那味了。

OpenCLI内置了100+站点适配器,小红书、B站、知乎、豆瓣、虎扑、贴吧这些国内主力平台都有,海外站Twitter/X、HackerNews、Pixiv也没落下。

opencli zhihu search “AI Agent”
opencli zhihu download —url “文章地址” —output ./zhihu

图文/视频/音频一键下载,文章导出Markdown/CSV/JSON,页面点击、翻页、表单填写、批量爬取数据,创作者数据、粉丝分析、评论区抓取……

OpenCLI给AI Agent准备了一个opencli-adapter-author skill

通过npx skills add jackwener/opencli —skill opencli-adapter-author安装,Agent就能帮你自动写适配器;

社区还有插件系统,opencli plugin install能一键装别人写好的适配器,生态这块儿算是慢慢铺开了。

通过CDP协议,OpenCLI能直接操控Electron桌面应用的界面,不用手动点鼠标。

Cursor的Composer、聊天和代码提取能控,ChatGPT的macOS桌面端能自动化,Notion能搜索、读取、写入页面,OpenAI Codex CLI能无头驱动,Discord桌面端的消息、频道、服务器操作也能跑。

项目地址:https://github.com/jackwener/OpenCLI

量子位 QbitAI