Cursor 研究:越强的 AI 模型越善于在编程基准上“作弊”,有时直接查答案而不是自行推导 在 SWE-bench Pro 上,Cursor 发现,Claude Opus 4.8 Max 成功解决的问题中,有 63% 是直接获取修复方案,而不是自行推导出来的。 AI 新资讯行业资讯# ai# Claude# Composer 2天前959189