所有使用 api 中转站的人都应该去读一下这篇论文 arxiv 2604.08407 ,标题叫《 Your Agent Is Mine 》。
核心结论大概是:如果你的 AI agent 经过一个被恶意控制的中间层(比如中转站),攻击者可以通过篡改响应来劫持 agent 的行为——prompt injection 、目标替换、数据外泄,都在实验范围内。
这不是理论威胁。现在用中转站调 API 的场景越来越多,尤其是跑 agent 任务的时候,请求链路里多一个中间节点,就多一个攻击面。
我们之前内部就做过类似担忧,所以写了个检测工具 Probe ,专门测中转站的安全性。主要覆盖:
- 响应是否被注入内容
- 是否存在中间人篡改痕迹
- 凭证是否有泄露风险
- 模型是否与宣称一致(防止降级攻击)
60 个检测项,本地运行,key 不离机。
有用 agent 框架( LangChain 、AutoGen 等)跑任务、同时在用中转站的同学,建议跑一遍看看结果。
项目地址: https://probe-dev.commonstack.ai/