我让 Claude Fable 5 审查我们自己写的一个后端服务,主要是找 bug 和安全漏洞。

结果第二次直接触发黄色安全警告,说对话命中安全检测,模型能力被降级到 Opus 4.8。

再一看额度,91% 没了。

关键是,整个过程几乎什么都没干成:代码没审完,漏洞没分析出来,额度却只用了3分钟就耗干了。
更离谱的是,审查自己项目里的安全漏洞,本来就是很正常的代码漏洞和安全审查场景,但实际用起来很容易被误判成高风险内容,然后直接降级。
虽然 Anthropic 因为这个事情道歉,但还是感觉让人很不爽。
从成本来看,这个模型,对于大多数公司来说,还没办法落地。
我将会在他每次额度刷新后输入“继续”,看他能不能在订阅结束之前完成这个任务。

© 版权声明
文章版权归作者所有,未经允许请勿转载。
