5 月 28 日消息,Google 这个单词里有几个字母 P?谷歌给出的答案是两个。
谷歌的人工智能摘要(AI Overview)还称,单词“poop”里有一个字母 r,而“journalism”一词包含两个字母 d,可它给出的拼写却是:j-o-u-r-n-a-d-i-s-m。谷歌倒是正确识别出了美国总统的姓氏里有一个字母 P,却把姓氏拼写成了 t-r-p-u-m。
width=”602″ height=”680″>
width=”514″ height=”680″>
其实不难预见,谷歌这场以人工智能为核心的搜索功能改版会问题频出。类似状况此前就发生过。谷歌首次在搜索中上线人工智能摘要功能时,该模块曾引用一些恶搞帖子,甚至给出诸如“吃石头”“往披萨上涂胶水”这类离谱建议。
谷歌在发给 TechCrunch 的邮件声明中表示:“大语言模型一直存在单词字母计数方面的难题,我们正着手解决这一具体问题。”
IT之家注意到,这类低级拼写错误并不罕见。驱动聊天机器人及各类文本生成工具的大语言模型,其设计初衷本就不是识别拼写。多年来圈内一直有个梗:每当有企业推出新款人工智能模型,你就可以考考它,问问单词 strawberry 里有多少个字母 r。这些人工智能模型能几秒内编写应用程序,也能攻克困扰数学家数十年的难题,可在拼写方面,水平却和幼儿园孩童相差无几。
不过,谷歌人工智能摘要暴露出的问题远不止这些滑稽的拼写错误。上周就曾出现过一处漏洞:用户搜索“disregard”(忽视),页面本该显示该单词的词典释义,结果却跳出这样一句话:“收到。你随时可以提出新指令或问题。”目前这一漏洞已被谷歌修复。但各类拼写错误依旧层出不穷,也成了大家津津乐道的槽点,因为这类问题实在难以彻底根除。
研究人员此前在解读这类拼写难题时解释过,人工智能并不会像人类那样,把句子看作由单词、字母构成的语言单元。多数大语言模型基于 Transformer 架构搭建,会将文本拆分为词元(token)—— 不同模型拆分出的词元可能是完整单词、音节或是单个字母。人工智能不会像人一样“阅读”文本,而是先把文本转化为数字表征,再结合语境分析,进而生成逻辑回复。
阿尔伯塔大学人工智能研究员、助理教授马修・古兹迪亚尔接受 TechCrunch 采访时说道:“大语言模型依托 Transformer 架构运行,它本质上并非在阅读文本。当你输入指令,内容会先被转换为编码。比如它识别单词‘the’,只会对应一个专属编码,却无法区分组成这个单词的字母 T、H、E。”
谷歌人工智能摘要这类大语言模型所依赖的词元架构,本身就存在固有局限。研究人员也并不看好其能彻底解决拼写问题。
波士顿东北大学专攻大语言模型可解释性的在读博士谢里丹・福伊希特表示:“对语言模型而言,如何准确定义‘单词’本身就是一大难题。即便行业专家能敲定一套完美的词元词汇表,模型大概率仍会选择进一步合并拆分文本片段。依我判断,受这类模糊性影响,不存在绝对完美的词元分词器。”
对研究人员来说,拼写问题也并非亟待解决的要务,毕竟大语言模型的核心价值本就不在于拼写能力。但这些明显的失误也提醒着我们:即便人工智能有时看似无所不知、高深莫测,它也并非完美无缺。面对人工智能给出的结果,我们绝不能盲目采信,务必核实其准确性。
