
按理来说就应该叫Kimi K3啊,从第六跳到第一,只值得加个Thinking吗,哈吉kimi,你这家伙。本来我都备好34个编程case让Kimi K2 Thinking写了,但是测下来它的创意写作太值得我给它单开一页,所以来吧,久违的大模型全测,从创意写作,联网搜索,模型智力,学术,编程(MacOS复刻,动态SVG)六大类出发!
还是先来点我们熟悉的编程热热身,
这个还是一次性生成的,自带文件管理,文本编辑,画画,视频播放,日历,计算器,画廊,终端,还能带设置页面,一句话生成软件原型越来越有盼头了。下一步试试看3D测试,物理小球在我这快淘汰了,基本上新出的模型就没有不会写的,Kimi K2Thinking做出来的带星球视觉拉大,视角复原,星系旋转加速,仔细看星球们自转的时候还会有对应的阴影切换。
这次的代码测试用的是新的Kimi Cli,自带四大类的10种工具

kimi-cli的配置一共是五步,分别是安装uv和kimi-cli,进入对应的文件夹用kimi启动cli,再用setup配置api,安装过程有问题直接丢给网页版Kimi K2 Thinking解决就好(原汤化原食了属于是)。
curl -LsSf https://astral.sh/uv/install.sh | sh
uv tool install --python 3.13 kimi-cli
cd your project
kimi
/setup
看到这样就成了,
okok,我们留点空间给后续的测试,到创意写作的环节了,直接上Gemini-2.5-pro
PS:图很长,这次还是盲测,滑倒底部有模型名字,而且后面还有更多内容哦,


长文创意测试真的很难在有限的文章长度全部展示出来,所以我让它们互相毒舌评价一下对方的文章。看了对方的文章,它们是这样想的,

听了对方的评论后,它们是这样回击的,

火药味浓的时候就要来点就算生气该做不出来还是不出来的智力题

这个题的难点在要求模型同时跟踪多个变量和约束,并计划一系列步骤,从而得出有效的解决方案,还要学会在遇到无效配置时恢复到之前。Kimi K2 Thinking给出的答案是,7次渡河(3次去,4次回),关键是在第5-6步让儿子而非父亲返回,打破循环。

GPT5给出的中间步骤没有连起来,Kimi分析的约束规则是儿子 (Son) 不能在父亲不在场时与食物 (Food) 独处,猴子 (Monkey) 不能在父亲不在场时与食物 (Food) 独处。但是GPT5得到结论却是儿子 + 猴子 (父亲不在场) 也会失败,这样就形成了一个三约束无解问题。

复杂信息搜索和学术能力可以组合成一个case,

先看看Kimi K2 Thinking跟DeepSeek V3结构对比的图再问,
我来客串个课代表,总结一下区别,Kimi K2 Thinking用了更少的heads,更多的experts,放弃了AdamW优化器,采用了Muon,采用了非分层路由的专家,且Dense层比DeepSeek 更少,好处就是在不增加激活参数量下将专家容量提升50%。Kimi K2 Thinking也是有值得优化的点,在Kimi Cli上同一任务的平均运行时长会比GPT5 Codex久,除外API本身速度的因素外,因为我已经是Tier3了,会偶尔出现网页读取or文件写入的工具需要重复执行的情况。感觉Kimi啥都不缺了,要Agent,有OK Computer,要模型,有Kimi K2和Kimi K2 Thinking,要Deep Research,也有深度研究模式,要Cli,有Kimi Cli,要闭源,有开源,我想想还是什么可以许愿的,要不也出个AI浏览器吧。
@ 作者 / 卡尔
