谷歌 AI 摘要频现低级拼写错误，大语言模型固有缺陷难根治

5 月 28 日消息，Google 这个单词里有几个字母 P？谷歌给出的答案是两个。

谷歌的人工智能摘要（AI Overview）还称，单词“poop”里有一个字母 r，而“journalism”一词包含两个字母 d，可它给出的拼写却是：j-o-u-r-n-a-d-i-s-m。谷歌倒是正确识别出了美国总统的姓氏里有一个字母 P，却把姓氏拼写成了 t-r-p-u-m。

谷歌 AI 摘要频现低级拼写错误，大语言模型固有缺陷难根治 width=”602″ height=”680″>

谷歌 AI 摘要频现低级拼写错误，大语言模型固有缺陷难根治 width=”514″ height=”680″>

其实不难预见，谷歌这场以人工智能为核心的搜索功能改版会问题频出。类似状况此前就发生过。谷歌首次在搜索中上线人工智能摘要功能时，该模块曾引用一些恶搞帖子，甚至给出诸如“吃石头”“往披萨上涂胶水”这类离谱建议。

谷歌在发给 TechCrunch 的邮件声明中表示：“大语言模型一直存在单词字母计数方面的难题，我们正着手解决这一具体问题。”

IT之家注意到，这类低级拼写错误并不罕见。驱动聊天机器人及各类文本生成工具的大语言模型，其设计初衷本就不是识别拼写。多年来圈内一直有个梗：每当有企业推出新款人工智能模型，你就可以考考它，问问单词 strawberry 里有多少个字母 r。这些人工智能模型能几秒内编写应用程序，也能攻克困扰数学家数十年的难题，可在拼写方面，水平却和幼儿园孩童相差无几。

不过，谷歌人工智能摘要暴露出的问题远不止这些滑稽的拼写错误。上周就曾出现过一处漏洞：用户搜索“disregard”（忽视），页面本该显示该单词的词典释义，结果却跳出这样一句话：“收到。你随时可以提出新指令或问题。”目前这一漏洞已被谷歌修复。但各类拼写错误依旧层出不穷，也成了大家津津乐道的槽点，因为这类问题实在难以彻底根除。

研究人员此前在解读这类拼写难题时解释过，人工智能并不会像人类那样，把句子看作由单词、字母构成的语言单元。多数大语言模型基于 Transformer 架构搭建，会将文本拆分为词元（token）—— 不同模型拆分出的词元可能是完整单词、音节或是单个字母。人工智能不会像人一样“阅读”文本，而是先把文本转化为数字表征，再结合语境分析，进而生成逻辑回复。

阿尔伯塔大学人工智能研究员、助理教授马修・古兹迪亚尔接受 TechCrunch 采访时说道：“大语言模型依托 Transformer 架构运行，它本质上并非在阅读文本。当你输入指令，内容会先被转换为编码。比如它识别单词‘the’，只会对应一个专属编码，却无法区分组成这个单词的字母 T、H、E。”

谷歌人工智能摘要这类大语言模型所依赖的词元架构，本身就存在固有局限。研究人员也并不看好其能彻底解决拼写问题。

波士顿东北大学专攻大语言模型可解释性的在读博士谢里丹・福伊希特表示：“对语言模型而言，如何准确定义‘单词’本身就是一大难题。即便行业专家能敲定一套完美的词元词汇表，模型大概率仍会选择进一步合并拆分文本片段。依我判断，受这类模糊性影响，不存在绝对完美的词元分词器。”

对研究人员来说，拼写问题也并非亟待解决的要务，毕竟大语言模型的核心价值本就不在于拼写能力。但这些明显的失误也提醒着我们：即便人工智能有时看似无所不知、高深莫测，它也并非完美无缺。面对人工智能给出的结果，我们绝不能盲目采信，务必核实其准确性。