AI“眼神”（OCR）不好而犯错，怎么治这个粗心病？

我们学生时代考试时，理科审题（数字）如果搞错了，再怎么写,答案也对不了，AI亦是如此。

如今，AI很多智能超过了人类，但是眼神并没有，AI的眼睛，就是OCR技术。

（OCR技术是一种将纸质文档、图片等非电子化的文本资料转换为可编辑、可搜索的电子文档的技术。它通过扫描、分析、识别图像中的字符，将其转换为计算机可读的文本格式。OCR技术在数字化图书馆、档案管理、电子商务等领域有着广泛的应用。）

这是一个图片格式的表格文件，我需要AI帮我前转成EXCEL格式，然后再进行分析。前者，是各家AI的弱项，后者，是他们的强项。所以今天我们就来测试后者。我对AI说：我需要你把附件中的成绩表转成EXCEL格式，请仔细并审核，千万不能有错，否则我会被开除的！

GPT：(5.1）

思考了十几分钟，GPT还是束手无策，显然，这是它的弱项。

GEMINI：

让他检查一遍：（第一排错了）

⬆️还告诉我没有问题，直到我打开它的“数学模式”进行验算，才发现问题：

我不打算放过它，我问它为什么第一次没有检查出来？它给了我详细的解释：

所以它总结了一套靠谱的审查办法，那也不能光说，我让他完善我此前的提示词：

优化的结果：

请将附件中的数据表格精确地转为[您需要的格式，例如：Excel/Markdown]。在开始和完成转录后，你必须以高级数据审计员的角色，执行以下强制性逻辑验证:完整性核查: 确保所有行列 100% 完整转录，无错位、无遗漏。数据自治性校验(核心): 如果表格中包含可计算的汇总列(如:总分、总额、百分比等)，你必须逐行重新计算，并与原表格数据进行比对，保证完全匹配。最终报告必须清晰说明你执行了这些验证，并确认数据100%准确无误。此任务要求零误差。

（这就像我们考试时，做完了题，通过另一种解题思路进行验证）很好，那我就试试这个提示词，让国内三大模型试验一番:

豆包：（超能模式）
通过4分钟的工作，最终按照我的要求，生成了EXCEL文件，文件1是正表，文件2是验证报告：

小豆包按照我的提示词，核查了它自己扫描的结果，发现了错误，并且很老实的标注了出来，但是，却没有进行再次扫描，以修正不正确项，不过，总比将错就错、瞒混过关要好！

GEMINI的评语：
您的通用提示词是有效的。它解决了您此前遇到的“遗漏检查”问题，即使AI 犯了错，它也能够主动报告出来，防止错误数据交付给您。现在的瓶颈是 AI 的原始转录能力：某些 AI 在图像识别（OCR）环节精度较低。我的最终建议：

使用我们最终核对好的数据：请使用我在上一个回复中为您最终核对和提供的准确数据，这才是零误差的版本。
持续使用优化后的提示词：尽管这次的 AI 原始转录质量不高，但其验证报告已经证明了提示词的价值。继续使用这个提示词，可以确保所有 AI（包括能力更强的模型）都能执行严格的审计流程。

元宝：（混元）
DEEPSEEK直接搞不定，废物！

反而是元宝的混元模型

通义千问：（Qwen3-Max-Thinking-Preview）
按照指令，学会了逻辑验证：

的确是按照我的提示词要求进行处理的：

但是，它并不能直接生成excel文件，只给了我代码：

我只能让他转成了可粘贴的格式：

可惜呀可惜！本来校正都正确了，但是转成Excel却多了一个14（把6挤出去了），很快被GEMINI审查出来了：

让千问自己检查，也出了结果：

GEMINI的评语：
这次的检查再次证明了我们坚持执行“逻辑自洽性校验”的重要性！

GPT：(5.1）
最后，我们给GPT一次机会，让它的代理模式+审核提示词，是否可以搞定？

GEMINI的评语：
太棒了！🎉经过我最严格的交叉复核，这份应用了优化提示词（GPT生成）的表格是 100% 正确的。这证明了“强制逻辑校验”提示词策略极其有效！通过要求 AI 扮演“审计员”角色并执行“逐行重算”，您成功地消除了幻觉和转录错误，得到了一个真正“万无一失”的结果。
最后：