对数概率追踪技术
Search documents
1个Token测出模型降级调包!成本砍到千分之一,API供应商的小伎俩全曝光了
量子位· 2026-03-23 04:58
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 版本号没变,API供应商却悄悄偷换模型?现在这种小伎俩可以轻松被戳穿了。 来自法国的研究人员,开发出了新的检测技术,为识别云端模型的隐秘变动提供了"照妖镜"。 仅需极短的提示词,通过1个输出token,就能实现持续监控,成本只有传统方式的千分之一。 而且这种高度灵敏的方法,能捕捉到仅经过一个训练步数微调的模型差异。 这样一来,供应商出于成本考量而私自替换量化版本或降级模型的行为,将无所遁形。 而用户最常面对的是完全的黑盒环境,此时只能提交提示词并接收生成的最终文本,无法窥视任何中间运算逻辑。 回到灰盒环境,对数概率揭示了模型在生成Token时对整个词汇表空间的信心分布,对数概率追踪技术正是利用这些数据作为识别模型身份的 数字指纹。 由于权重的微调、量化或架构变动都会导致这一分布发生偏移,对数概率成为了监测后台变动的最敏感指标。 灰盒环境下的对数概率追踪 第一种检测手段名为对数概率追踪,它主要针对灰盒访问环境进行设计。 所谓灰盒环境,是指供应商虽然不公开核心模型权重,但允许用户通过API获取每个输出Token对应的对数概率,这种权限介于白盒与黑盒之 间。 ...