OpenAI把ChatGPT的默认模型换成了GPT-5.5 Instant,就不是为了做个又快又好的编程模型。我第一时间想到的就是更适合当个通用助手了。平时电脑端都默认用Thinking,写代码,做计划的时候会打开Pro。GPT-5.5 Instant就应该焊死在手机端上。两个月前我去意大利旅游挑战了全程用GPT,看看有没有比视频通话拍个照问这个是啥更好的用法。先来个10s前期回顾,在高风险领域,医疗,法律,金融这些,GPT-5.5 Instant比5.3 Instant少了52.5%的幻觉。AIME 2025(数学)从65.4跳到81.2,MMMU-Pro(多模态理解)从69.2跳到76。回答也变短了,词少了30.2%,把用力过猛的emoji砍了。在API里叫chat-latest,400k上下文,价格按GPT-5.5走,输入$5,输出$30每百万token。GPT-5.3会在三个月跟我们拜拜。

还有一个我觉得更重要的变化,记忆。现在可以调用过去对话,上传文件,还有邮箱里的上下文来回答问题。旁边还会显示记忆来源,告诉你这次到底用了哪些记忆。你可以删掉过时的,也可以纠正错误的。分享对话的时候,对方是看不到这些记忆来源的。但我这次想聊的,不是5.5 Instant跑分涨了多少,适不适合拿来写代码。Instant的正确用法根本不是在电脑前面跟Thinking抢活,它应该是随身带着的通用助手。前面不是说了我尝试用GPT来处理旅途里的各种小问题嘛,印象特深的是有次刷完银行卡,服务员转头就走了。我看着机器有点懵,不知道它到底是已经付款成功,还是还需要按什么确认。

这类问题你怎么搜索,都很难组织出提问的问题,也不太可能临场叽里咕噜一大段英文去问服务员。最简单的动作就是拍给GPT,让它看一下屏幕上的状态,告诉我大概是不是已经成功了。这就是Instant最适合的场景。不是深度推理。是你在现场不到10s,有个很急很具体的问题,我只需要语音输入就能被稳稳接住。再比如我们去看罗马的喷泉。因为是两个人旅行,我就kuku讲解。以前可能要提前查资料,打开小某书每个帖子看一点,然后拼一个大概。但真站在喷泉前面的时候,发生的动作非常简单。掏出GPT,拍一下。它就开始讲。


它好像知道我现在在旅行,知道我不想打很多字,所以它不会只给一个百科式介绍。它会顺手补一些隐藏信息,观看角度,附近还能看什么,甚至会给我一些实际的小建议。


这就是默认模型短回答的好处。你在路上不是来读论文的。你只是想让它在30秒内,把眼前这个东西变得更有意思一点。不过这里也有一个小坑,Instant记得我是个内容创作者,然后在不该发力的地方发力。我明明就只是在看喷泉,它突然开始说,要不要顺手做一个脚本。

这也是记忆接入之后最真实的问题,它会更懂你,也容易懂过头了。所以这次Memory Sources这个功能很有必要。我能知道它这次到底拿了哪段记忆在脑补。我这次还还还发现了一个新玩法。我现在出门已经习惯性带着飞书多维表格记录内容,看到有意思的东西,顺手丢进去,后面可以慢慢整理成素材。以前这个动作更像记流水账,记下我看了什么,去了哪里,拍了什么。这次我突然意识到,GPT可以把这个记录动作变成一个小型采编系统。比如在看最后的晚餐的时候,导游周围人非常多,声音又小,我当时站得也不算近,很多内容其实没有听完整。我当时就是嘎巴把手臂伸长,让手机先录音,回来转成文字,再让GPT根据录音里已经捕捉到的内容,补充那些没听清,没录到的部分。

我就只记得导游提到了颜色,颜料,壁画方法,GPT把颜色来源,使用方式和背后的意义连起来了。还有啊,看博物馆的时候,我拍到了展牌,但字小得像蚂蚁,它在赶路途中给你讲。

最后的晚饭的说明文字可能都快有5米长,但参观时间只有半小时。我一边听导游,一边看展品,一边拍照,根本不可能站在那里读完。以前错过就错过了。现在不是。你先拍下来,后面让GPT讲。甚至路上边转场边听它讲。这种感觉非常爽,因为它把旅行里那些本来会漏掉的细节捡回来了。还有一次更离谱。我们在意大利临时遇到了一个可口可乐活动,一开始完全不知道是什么。现场看起来像快闪体验馆,又像品牌活动,又像某种展览。我直接问GPT。它告诉我,这个活动跟冬奥主题有关。接着我问需不需要预约,怎么进去,现场有什么玩法。更骚的是,我还问到了Wi-Fi密码。。。

这种体验就很难用传统搜索解释。传统搜索是你带着明确关键词去找答案,但旅行现场很多问题根本没有关键词。你看到一个东西,你只知道它在你眼前,你不知道它叫什么。GPT的优势就在这里。它能先找到名字再追问,我甚至可以站在一个地方360拍几张图来找景点入口。


深度探索这块还有一个小例子。在威尼斯有一家咖啡馆,我进去之后觉得装修挺有意思,但也只是觉得有意思而已。后来通过GPT才发现,那里居然有6个不同风格的房间。

这个信息如果不问,可能就从眼前飘过去了。这下我也不着急一个个点快速打卡了,也不需要打开三毛游满景点来回跑,我就站在我爱看的地方边拍边听。还有一次让我成功赶上了最后一班车,去威尼斯的时候,不小心前一站下车了,这两个站名的区别可能就是翻译成中文就是威尼斯前站和威尼斯站的区别。就当时那种感觉你知道吧。人已经下车了,结果一刷地图上显示离目的地还有一段,脑子马上懵了,下一班车还有多久,能不能打车,不然直接走过去行不行。我直接把手机里的地图位置截图发给GPT,让它告诉我现在有哪些方式可以到威尼斯。


这时候GPT比某书好用的地方就出现了。GPT适合处理不确定性。原计划走不通的时候,我需要的就不是一篇攻略,是一个根据我当前位置,时间,预算重新适配方案的通用助手。南意大利那段更典型。当地几乎没有能放行李的公共交通,很多地方只能打车。我出发前在小红书看了几百个帖子(小夸张),几乎都在说打车会坑人,双倍价。所以一上车我就很紧张。真的就是高度防御。盯着后视镜,盯着打车软件,看司机有没有偏航,心里一直盘算这个价格会不会翻倍。

在GPT的建议下反复跟司机沟通沟通,no music,no talk,no绕路就算防守那么严还是比预料中贵了10欧,但跟那些被双倍价格比,已经算能接受。这种小事如果单独拿出来讲,好像都蛮不酷的,不是那种多Agent连续24小时裤裤干大事。但手机端的GPT体验就是由这些小事组成的。它不是低配Thinking。它更像一个现实世界的缝隙助手。我需要的是它在登机口,售票机,咖啡馆,出租车后座,博物馆走廊里,用个五六秒就能把当下这件事解决了。广告模式,其实之前就有,现在只是跟着GPT-5.5 Instant上线后就更明显了。我让GPT推荐蓝洞玩法,并明确要求找导游。它会在不同地方给我不同路线和导游公司,甚至带公司名称和评分。

小缺点就是这些中间推荐不一会出现在回答末尾的来源链接里。所以你要二次判断,它推荐的内容到底对不对,评分来自哪里,有没有中文导游。最后的最后,吐槽一下GPT对什么叫轻松游理解得非常抽象。五一给我规划了一个云南7天自驾游,结果开车开到我都要吐了。总的来说,我的使用思路其实很简单。买票,打车,点餐,排队,转车,登机,这些所有小到你以前懒得问AI的问题,才是Instant真正应该用起来的地方。那一刻你不会想,到底用了多少token。你只会觉得,提前装的App都用不上了,这玩意越来越像通用助手了。
