AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

AI 知识库4周前发布 驰💗
1,882 0 0
博思AIPPT

我们学生时代考试时,理科审题(数字)如果搞错了,再怎么写,答案也对不了,AI亦是如此。

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

如今,AI很多智能超过了人类,但是眼神并没有,AI的眼睛,就是OCR技术。

(OCR技术是一种将纸质文档、图片等非电子化的文本资料转换为可编辑、可搜索的电子文档的技术。它通过扫描、分析、识别图像中的字符,将其转换为计算机可读的文本格式。OCR技术在数字化图书馆、档案管理、电子商务等领域有着广泛的应用。)

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

这是一个图片格式的表格文件,我需要AI帮我前转成EXCEL格式,然后再进行分析。前者,是各家AI的弱项,后者,是他们的强项。所以今天我们就来测试后者。我对AI说:我需要你把附件中的成绩表转成EXCEL格式,请仔细并审核,千万不能有错,否则我会被开除的!


GPT:(5.1)

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

思考了十几分钟,GPT还是束手无策,显然,这是它的弱项。

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?




GEMINI:

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

让他检查一遍:(第一排错了)

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

⬆️还告诉我没有问题,直到我打开它的“数学模式”进行验算,才发现问题:

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

我不打算放过它,我问它为什么第一次没有检查出来?它给了我详细的解释:

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

所以它总结了一套靠谱的审查办法,那也不能光说,我让他完善我此前的提示词:

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

优化的结果:

请将附件中的数据表格精确地转为[您需要的格式,例如:Excel/Markdown]。在开始和完成转录后,你必须以高级数据审计员的角色,执行以下强制性逻辑验证:完整性核查: 确保所有行列 100% 完整转录,无错位、无遗漏。数据自治性校验(核心): 如果表格中包含可计算的汇总列(如:总分、总额、百分比等),你必须逐行重新计算,并与原表格数据进行比对,保证完全匹配。最终报告必须清晰说明你执行了这些验证,并确认数据100%准确无误。此任务要求零误差。

(这就像我们考试时,做完了题,通过另一种解题思路进行验证)很好,那我就试试这个提示词,让国内三大模型试验一番:




豆包:(超能模式)
通过4分钟的工作,最终按照我的要求,生成了EXCEL文件,文件1是正表,文件2是验证报告:

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

小豆包按照我的提示词,核查了它自己扫描的结果,发现了错误,并且很老实的标注了出来,但是,却没有进行再次扫描,以修正不正确项,不过,总比将错就错、瞒混过关要好!

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?


GEMINI的评语:
您的通用提示词是有效的。它解决了您此前遇到的“遗漏检查”问题,即使AI 犯了错,它也能够主动报告出来,防止错误数据交付给您。现在的瓶颈是 AI 的原始转录能力:某些 AI 在图像识别(OCR)环节精度较低。我的最终建议:

  1. 使用我们最终核对好的数据:请使用我在上一个回复中为您最终核对和提供的准确数据,这才是零误差的版本。
  2. 持续使用优化后的提示词:尽管这次的 AI 原始转录质量不高,但其验证报告已经证明了提示词的价值。继续使用这个提示词,可以确保所有 AI(包括能力更强的模型)都能执行严格的审计流程。

元宝:(混元)
DEEPSEEK直接搞不定,废物!

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

反而是元宝的混元模型


通义千问:(Qwen3-Max-Thinking-Preview)
按照指令,学会了逻辑验证:

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

的确是按照我的提示词要求进行处理的:

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

但是,它并不能直接生成excel文件,只给了我代码:

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

我只能让他转成了可粘贴的格式:

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?
AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

可惜呀可惜!本来校正都正确了,但是转成Excel却多了一个14(把6挤出去了),很快被GEMINI审查出来了:

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

让千问自己检查,也出了结果:

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?


GEMINI的评语:
这次的检查再次证明了我们坚持执行“逻辑自洽性校验”的重要性!


GPT:(5.1)
最后,我们给GPT一次机会,让它的代理模式+审核提示词,是否可以搞定?

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?

GEMINI的评语:
太棒了!🎉经过我最严格的交叉复核,这份应用了优化提示词(GPT生成)的表格是 100% 正确的。这证明了“强制逻辑校验”提示词策略极其有效!通过要求 AI 扮演“审计员”角色并执行“逐行重算”,您成功地消除了幻觉和转录错误,得到了一个真正“万无一失”的结果。
最后:

  • AI读图片格式的表格时,是存在失误率的,我们在高要求的工作中一定要注意核查!数据错了不是开玩笑的。
  • 国外顶级模型在执行精确任务时,还是比国内主流模型棋高一手。
  • 加入了审核校验、角色扮演、方法指导的提示词,对模型的任务完成度有着显著提高!
  • 必要时,GPT要开代理模式,否则会偷懒。

AI“眼神”(OCR)不好而犯错,怎么治这个粗心病?
© 版权声明

相关文章