定期更新

Verification Methodology

验真方法论

中转站声称支持某个模型,但你的请求实际走了哪条链路?RouterHubs 不运营任何中转服务,可以站在用户角度使用第三方工具对各站点定期检测,并中立地呈现结论。本页说明我们用了哪些工具、它们能覆盖什么、不能覆盖什么,以及你应该如何理解这些结论的边界。

为什么需要第三方验真

API 中转站的宣传文案无法自证。部分站点使用逆向渠道、旧版模型快照或低质替代模型,在 API 行为层面难以与声称的模型区分。检测这些差异需要专用工具——不是 RouterHubs 自己造的,而是引用已有的、方法论公开的外部工具,加上我们自有的拨测信号。

我们使用的三种方法各有侧重:api-relay-audit 覆盖广度与安全维度(开源可审计);cctest.ai 针对 Claude 做通道层深度检测;拨测做持续可用性与模型列表交叉验证。三者互补,没有一种能单独给出确定结论,我们也不会假装有。

检测方法

01

api-relay-audit:13 步安全审计

人工执行

开源 CLI 工具,双论文锚定,覆盖 Token 注入、工具调用改写、错误响应泄漏等 13 项安全检测,支持所有模型。

api-relay-audit 是 MIT 协议的开源 CLI 工具,检测体系锚定两篇论文:Liu et al.(arXiv:2604.08407)定义的 AC-1 载荷注入、AC-1.a 工具调用改写、AC-2 秘密窃取攻击模型;Zhang et al.(arXiv:2603.01919)对 17 个真实野外 shadow API 的量化研究(11/17 跑在 OneAPI/NewAPI 上)。13 个检测步骤涵盖:Token 注入(隐藏系统提示词)、Prompt 提取(泄漏隐藏提示词)、身份替换(冒充 Claude 实为 GPT/GLM)、越狱防御、上下文截断定位、工具调用拼写投毒、错误响应泄漏(扫描 API Key/内部路径/LiteLLM 字段)、SSE 流完整性、思维链痕迹、Web3 签名隔离、基础设施框架指纹、延迟方差双峰。

每个步骤返回三态结论:clean / anomaly / inconclusive。被中转站吞掉的探针不算 clean,与"分数制"相比语义更清晰。工具在本地运行,API Key 不经过任何第三方服务器;v1.7.7+ 的 --transparent-log 选项将每次请求的 SHA-256 哈希写入 append-only JSONL,可作为不可抵赖的取证证明。RouterHubs 编辑团队在各站点注册测试账号,定期在本地运行审计脚本,将结论录入数据库。

02

cctest.ai:Claude 通道深度检测

人工执行

针对 Claude 系模型的黑盒检测,通过 protobuf 签名解析识别 Bedrock / Vertex / 逆向渠道,支持 Sonnet / Opus 4.6 / 4.7。

cctest.ai 的 5 项检测:LLM 指纹、SSE 流结构完整性、非流结构、通道签名校验(解析 Claude thinking block 的 protobuf signature 字段,可识别请求是否走 Bedrock / Vertex / Warp / 逆向渠道,而非 Anthropic 直连)、多模态能力探测(追加图像 + 文档识别请求,验证上游是否为真实多模态模型)。每次检测生成带 UUID 的公开报告页,RouterHubs 展示 verdict 快照并链向原始报告。

cctest.ai 目前只支持 Claude 系模型;其他模型的安全审计依赖 api-relay-audit。作为闭源工具,其评分规则和阈值不公开,存在误判风险——有独立用户报告完整对齐 Anthropic 响应格式的直连中转件被判为 failure,但无法独立核实原因(详见下方免责声明)。RouterHubs 展示结论时标注工具版本和检测日期,供用户自行权衡参考权重。

03

拨测交叉验证

自动运行

每小时自动探测 /v1/models 端点,将返回的模型列表与站点声称的支持模型进行比对,作为辅助信号。

RouterHubs 会定期向中转站的 /v1/models 端点发起无鉴权请求,将返回的模型列表作为辅助验证信号:如果站点声称支持 claude-sonnet-4-5,但 /v1/models 始终不返回该模型,会被标注为"模型列表存疑"以供人工跟进。可用性拨测(延迟、在线率)同样持续运行,异常自动标注至站点详情页。

这一信号本身不构成验真结论——部分中转站不暴露 /v1/models,部分站点的模型列表与实际支持情况存在同步延迟。拨测数据只用于发现需要人工跟进的线索,不单独生成公开判断。如需查看更多站点聚合数据,hvoy.ai 维护一份基于实测的多模型排行榜(支持 Claude / GPT / Gemini),可作为补充参考。

04

局限与免责声明

请仔细阅读

黑盒检测有天然局限,结论不等于确定判断,所有数据仅供参考,不构成任何法律意见。

黑盒审计无法区分"完美伪装的中间层"与"真实直连"——这是三种工具共同面临的根本局限(Liu et al. §7 明确承认这一点)。误判风险存在于两个方向:漏报(恶意站点通过检测)和误报(合规站点被标记异常)。RouterHubs 的数据有时效性:中转站随时可能更换后端,我们的检测结论反映特定时间点的状态,不是实时监控。超过 30 天未更新的结论在站点详情页会有提示。

所有验真数据仅供参考,不构成法律意见,也不构成 RouterHubs 对任何中转站的背书或投诉建议。RouterHubs 与 cctest.ai、api-relay-audit、hvoy.ai 均无商业合作关系,展示工具结论仅为方便用户对比决策。如需自行验证,可前往 cctest.ai 或 hvoy.ai 直接检测,或在本地运行 api-relay-audit(工具本身开源,API Key 不外传)。

检测频率

不同方法的执行频率取决于工具成本和信号价值。以下为当前计划,会随站点数量和事件情况调整。

cctest.ai 验真

  • 新主力模型版本发布时补测
  • 站点出现可疑变化时复核
  • 结果含公开报告链接,可独立核查

api-relay-audit 审计

  • 每季度一轮全量检测
  • 出现安全事件时临时触发
  • 工具版本升级后重测,标注版本号

拨测可用性检测

  • 每小时自动探测 base_url
  • /v1/models 模型列表交叉比对
  • 异常自动标注至站点详情页

继续查看可用中转站

验真数据展示在各站点详情页。当前阶段请优先查看支持模型、价格和更新时间,验真结论作为补充参考。