
什么人体工学键盘,人体工学鼠标都不需要了,配个麦克风,放在嘴边,边说话边打字。而且最近Clawdbot+Discord和Happy Code让我在手机上也能远程用电脑跑Agent任务和Claude Code,所以是时候来一个手机AI输入法的超级大横评了,说不定后面手机连键盘都不需要了。这次我们的选手有讯飞,豆包,搜狗,百度,微信和Typeless,都是在App Store上搜AI输入法找到的,我们先来个老罗同款测试,找个静音房间测试输入法们的识别率,再统计一下都有哪些AI功能

我们先拉一个大表,看看输入法们都有什么AI配置,

当然这里只测评这个输入法在其他应用打开的情况下,在输入的界面能用到的AI功能。如果把应用里AI功能(翻译,便签等)都统计上的话,我觉得它就脱离了日常使用输入法的范围。我将悄悄话(模拟办公室)的语音识别放在最前,简单来说,我会复刻罗永浩老师的评测方式,在一个相对静音的房间,持续性超低音念稿,每个输入法各测三遍,每次不间断地测试 5 分钟,最后来统计它们的准确率。
人声现场录制很难保证每一次都一样大小,所以我额外准备了一个Clawdbot的中文播客,明显是带思考,断句和多人互动的,看看它们识别的准确率是多少,结果还是比较出乎我意料的。


首先,讯飞和搜狗不愧是老牌做语音识别的,它的信息量,识别率以及丢失率控制,我觉得都可以排在前列位置,重复的语气词不会被直接误删掉,而是会根据语境做适当的保留。然后是豆包和微信会出现一个问题,比方说我多说几句,它就很容易断掉,我这段录音是一分三十八秒,是一个正常语速输入,并没有刻意为难,因为是我说了一遍,用录音录下来,然后在同样的距离播放给每个输入法听的。那百度做出来的长语音识别会出现一些语句重复的情况,而且它是可以主动打开长语音录制功能的,所以我觉得这个质量比我想象中的差异有点大。另外有一个比较特例的,应该是接入了大模型的Typeless方法。它的识别是目前最准的,但在短文本情况下,我目前还没法接受输入二十个字要识五六秒这样的场景,我修改的话还要切回到原生键盘。

搜狗的解决思路是录入了大量的互联网词库可以方便输入,新版本升级了大模型,能理解我的输入的上下文和意图。Typeless是当你主动纠正某一个词的语音识别错误的时候会收录到词库当中,豆包和搜狗都可以直接导入ios里你已经设置好的常用语。我个人是真希望可以这三个可以组合在一起用啊。搜狗还做了一个针对不同应用的打字优化,同样的gb两个字母,在微信,淘宝,京东,携程,美团是不一样的。

我们再看看输入法们自带最多的功能,AI写作讯飞,微信和搜狗,它们是自带内置模板,根据不同的语气来修改固定的段落,也可以叫做AI润色。我平时主要是临时用手机回复邮件的时候用,想让语气变正式点。其他场景的话,我更多是吃饭时为了优惠券写的评价。百度专门出了一大堆模板,但可惜生成这种模板需要消耗积分。虽然它还可以根据图片进行描述,但如果要消耗积分的话,我比较愿意手动录入,再让AI帮我做排版。所以目前来说,AI写作排名我会给到,微信 = 讯飞 =搜狗> 百度

再来看看排名第二多的功能,也就是AI搜索。这里我要说一下AI搜索在豆包输入法上会标注为智能联想。简单来说,如果你给它提一个问题,比方说西游记是谁写的,它会联想出作者的名字。至少在它的App Store截图上面显示是有这个功能的,但我测试了很多遍,发现这个功能不好触发。所以还是来看一下百度,微信跟搜狗的,

百度这个明显是百度AI搜,微信用的是DeepSeek和混元,搜狗是用的混元AI生成的,从引用的信息源来看,百度和微信都是排版比较简单,在输入法场景下,它们也不会像网页端那样标注信息来源。搜狗的话有表格排版,同时也会带上信息源。但我觉得这样已经够用了。如果我是在输入法上使用,我会希望它只回答一个很简单的东西。比方说,有的时候我可能忘了某个 AI 产品叫什么名字,我做一个简单的搜索,然后直接复制粘贴就可以了。如果我需要更详细的评价、更深入的信息或者是全面的研究报告,我觉得我不会在输入法上使用这个功能。但也许以后可以做到我通过输入法发布一个任务,交给这几家厂商对应的更高级的Deep Research产品,之后我可以通过剪贴板或者是电脑多端同步拿到这些信息。再一个就是我感觉还挺新奇,不知道大家有没有用过的功能,多语言实时翻译。简单来说,我在输入法上敲中文,输出的直接就是英文,不需要再长按选择翻译。它可以让你保持整体输入环境都是英文,并且在写完整句之后,它会进行二次翻译来纠正并保证质量

在翻译质量上,大家其实大差不差,很难拉开差距。我觉得真正的差距在于使用体验上:百度和微信是在上方提供一个输入框,我可以在框内输入。搜狗除了文字输入,还提供了语音输入。在这个场景下,哪个更好用主要取决于大家的使用频率。我很难给出一个定论,因为需要我写英文的场景,通常是在X或者Reddit里面写一些回复,很少会有写超长文的情况。如果是写长文章,我通常就直接用电脑写了。在我看来,语音输入和文字输入侧重点大概是50/50。最后我们来聊聊输入法特有的。搜狗的拍照翻译,Typeless和搜狗的AI再排版。其实讯飞也有拍照记录的功能,但它要在打开讯飞应用的前提下才能使用,所以我在这里并没有列出来。而搜狗这个拍照翻译其实也有缺点,虽然它可以在输入法里面激活,但在完成拍照翻译之后,返回的页面是应用而不是输入法。

为什么我要在一堆大厂产品里放入Typeless输入法呢?虽然这篇文章主要测评的是手机端,但在电脑端,我其实已经长时间对比闪电说和Typeless,最终选择了充值 Typeless会员。因为它在识别语音的基础上允许反悔。比如我在说话时候的犹豫,像是“啊,不是,应该是这样”这种在语音对话中的纠正,它识别并修正,还可以把长文本做一个分段。

但在手机端上,它的设计有点过于极端了,纯粹就是语音输入模式。我在用微信回复时,往往是短平快的输入,还是需要手写键盘的。哪怕我只说了5s,它依然需要一段thinking的时间。像搜狗,百度,微信就做了一个折中,我们可以选择主动触发搜狗新的校对和排版功能,比方我在发一段比较正式的通知的时候,
回过头来想想看,搜狗这次手机输入法有很多的AI功能,除了基础的打字,也不断融入AI辅助日常的表达和创作流,电脑版上也把AI润色排版翻译等功能上了,要是能再加上类似Typeless同款语音指令执行的功能的话,我会非常乐意用作我的主力输入法。心血来潮做这么一期,kuku测了12个小时,主要是最近用语音输入真的用得太多了,甚至都给自己配了一个麦克风来加快自己的语音输入速度。这种感觉真的会上瘾,它没有AI写作带来的AI味,写出来的就是你想说的,全是人感。而且这些都是我口头思路的表达,即使我后面再去修改它,也不会出现前后逻辑不一致。关键我是广door人啊,我说话速度比我打字都要快个两三倍。我觉得之后还能再把我的效率翻一翻。现在我们可以做AI 编程,AI 生图,AI 视频的这些输出方面已经做了非常多,有很多很好的产品。所以我每天都在体验,学习,甚至都来不及总结做教程,现在我觉得有这样的一个输入法作为一个搭桥,能够加快我们记录的速度,会是我们以后在短时间可以上手更多产品的,一个小小的前置条件,这,就足够了。
@ 作者 / 卡尔
