国产模型API接到Codex之后,还能跑通这10个核心玩法

AI 知识库18小时前发布 AI沃茨
676 0 0
熊猫办公
Agent界不能没有Coding Plan和Max x20订阅,就像麻婆豆腐里不能没有豆腐。中转API确实能省钱,但缓存失效之后9折没了,额度虚标,速率跟不上,上下文被动缩水,这些苦我是一点也不想吃了。Claude的API我现在也没什么招,老被封。GPT Pro现在也不敢断,谁也不知道它会不会哪天也学一下友商,突然来个身份验证。所以这次我想测一个更具体的,如果把国内模型API接进Codex App,它到底还能不能撑起一套真实可用的Agent工作流?刚好,Codex团队最近分享了如何把Codex用到极致的教程。于是我跟上线两个月,刚刚又上了新模型,之前也没专门测过的阶跃星辰Step Plan一拍即合,做了这次国内Codex玩法合集。

国产模型API接到Codex之后,还能跑通这10个核心玩法

我最先关心两个点。接了API之后,还能不能用手机端连Codex?锁屏状态下呢?答案是可以。Codex最近更新的双击Command键,然后截屏整个屏幕的功能,API模式下还能不能用?答案也是可以。这两个点解决了我最担心的事情,API模式不是一个残血版Codex,至少在我这次测试里,它还能保留Codex App关键的入口和交互。Step Plan这次可以通过配置模型名step-router-v1,根据任务复杂度自动在deepseek-v4-pro和step-3.5-flash之间切换。v4-pro刚还宣布了继续保持2.5折。四舍五入一下,这就有点像DeepSeek也出了一个Coding Plan。对Coding Plan我的要求其实不高,能随时买到的,额度别虚标的,Max token别动不动卡到8K的,上面这些缺点大家可以对号入座一把。。。

国产模型API接到Codex之后,还能跑通这10个核心玩法

PS:deepseek-v4-pro和step-3.5-flash的模型综合能力分,2603是step-3.5-flash的迭代版本

国产模型API接到Codex之后,还能跑通这10个核心玩法

PS:deepseek-v4-pro和step-3.5-flash的价格排名Step Plan里还塞了一个6B以下的image-edit-2模型,支持文生图和图像编辑。这个我后面也顺手测了一下。
把API接进Codex先说最实用的部分。我给大家做了一个脚本,它会自动引导你完成所有的配置,

curl -fsSL https://raw.githubusercontent.com/LearnPrompt/stepfun-codex-adapter/main/install_stepfun_codex_adapter.sh -o install_stepfun_codex_adapter.shchmod+x install_stepfun_codex_adapter.sh./install_stepfun_codex_adapter.sh

这个脚本主要做几件事,选择订阅类型,比如Plan或者普通订阅,选择对应模型;
检查你的电脑是否已经安装cc-switch和Codex,如果没有,它会帮你装好;
在cc-switch里把Step的API转换成Codex需要的Responses API格式。

国产模型API接到Codex之后,还能跑通这10个核心玩法

完成之后再打开Codex App,如果你在对话框右下角看到StepFun开头,就说明Codex已经从GPT账号登录切换到了API模式。

国产模型API接到Codex之后,还能跑通这10个核心玩法

接上API,Codex的功能还剩多少?开头我们已经测试了手机调用Codex App以及双击按键屏幕截图的功能。那下一步我们继续跟着Codex团队的思路,测了最近用得很多的浏览器自动化和电脑自动化。这次我还故意加了一个坑,我同时打开了两个不同个人资料的账号,这两个账号上都装了Codex的浏览器插件。在我的日常使用里,GPT-5.5有时候也会被这个场景迷惑到,不知道我要在哪个账号发X。从截图里可以看到,一开始step-3.5-flash它确实被虚晃了一枪,后面它发现需要切换到另一个Profile,最后大概探索了3到4轮,完成了推特发布。

国产模型API接到Codex之后,还能跑通这10个核心玩法

Computer Use当然也能做。我让它在飞书里给我的Hermes发一条消息,问问能不能操作Claude Code的文字信息。这怎么不算一次性把御三家都用上呢?

国产模型API接到Codex之后,还能跑通这10个核心玩法

这里也顺手把Codex App里的几个入口捋一下,browser|适合在侧边栏里做网页审查、阅读网页、标记页面,@chrome|适合那些需要浏览器登录态的工作流,@computer|适合处理只能在桌面GUI里点来点去的任务。Step Plan里还带了一个image-edit-2。来都来了,我在测试API接入Codex之后,在计划模式还能不能正常用的情况下,让他给我开发了一个可以调用这个图像模型的脚本。

国产模型API接到Codex之后,还能跑通这10个核心玩法

我试了一下,让6B以下模型生成一个大小字体的中文图片,难度还是比较高的。但我更多测试之后发现,拿它来修改图片里的文字,速度很快而且也很少改错。

国产模型API接到Codex之后,还能跑通这10个核心玩法
国产模型API接到Codex之后,还能跑通这10个核心玩法

还有两个我常用到的能力边界也要讲清楚。在测试过程中,对话时自动压缩上下文的能力是正常生效的。目前比较明确没有生效的是,因为是API登录,不是账号登录,所以如果你想通过已经登录到这个账号上的设备做连接,比如用MacBook Pro去操作非局域网的Mac mini,就不能直接连,这个时候还是要走SSH。

国产模型API接到Codex之后,还能跑通这10个核心玩法

Codex还有一个我很喜欢的交互就是任务跑一半的时候,可以进行任务干预。这个干预分成两种。第一种是引导,当你发现AI跑偏了,可以直接把它拉回来。比如我发送之后才临时想起来,想在第一个模块里加一些文字特效,就可以直接补进去。第二种是排队,它不会打断现在正在运行的任务,而是把新任务排在队伍后面。

国产模型API接到Codex之后,还能跑通这10个核心玩法

这也是顺带测了一下切换到DeepSeek V4 Pro后,模型做出来的网页质量了。

除了上面这些功能测试,Codex团队分享的自动化和目标设定(goal),也是我这次重点想测的地方。自动化的成功率还是比较高的。在Codex里面,它很多时候是以一个提示语的方式存在。右侧栏可以看到每次运行的成功率和失败率,也可以主动触发。我这里直接搬了一个AI日报提示语,用之前开发的AI热点伯乐Skill跑了一次。

跟自动化不同,Goals是为了更长时间的Codex任务准备的。你给它写一个明确目标之后,AI会在一段时间内持续完成它。如果你直接打Goal,Codex里没有出现相关选项,可以先在终端里输入:

codex features enable goalsEnabledfeature`goals`inconfig.toml.

等它起作用之后,重启Codex App,就会看到一个叫设置目标的选项。这就是我设计的一个目标,让模型开发一个用于AI图片展示的画廊网页。

国产模型API接到Codex之后,还能跑通这10个核心玩法

BTW,目标本身是可以中途修改的。当Codex能跑更长时间任务之后,我的下一个问题API版本的Codex还能保留记忆吗?Codex团队在用Codex的时候打开共享记忆,也推荐我们把持久上下文存在Obsidian这样的知识库里。我自己就是这么做的。我的Hermes,OpenClaw,Claude Code和CodeX,它们的默认目录就是Obsidian的vault。我会通过Agent.md来约束它们每次读取文件的次数。这样虽然我每次加载消耗的 token 会比直接在空目录上面要多一些,但我能以最快的速度启动我的任务。这次我让step-3.5-flash帮我查了一下,Obsidian里过去两个月存下来的、跟Codex工作流相关的数据有哪些,它们的路径分别在哪。

测试到这里的时候,我又发现了一个 API 版 Codex 缺失的功能,Chronicle记忆组件,它能帮Codex从你最近屏幕上发生的事情中提取并构建记忆,但是换成API后,这个功能就关了。

国产模型API接到Codex之后,还能跑通这10个核心玩法

最后又到了大家最关心的价格环节,Plan能不能长期用,最后还是要回到价格,额度和稳定性。这次我直接让GPT用绝对精准、不忽悠、把事情拆得明明白白、不焦虑、不踩坑、特别直白、不要绕圈子的方式,给了一版对比。

国产模型API接到Codex之后,还能跑通这10个核心玩法

我的感受是,这类测试Case很适合以后有新模型时继续复用。因为Codex现在的生态正在从一个编程Agent,逐步切换成一个通用Agent。你在它上面测功能完整度,提示语适配度,浏览器能力,桌面能力,长期任务和记忆协作,基本能很快看出一个模型到底能不能放到Agent里用。最后,也回答一下大家问得最多的问题:我的主力Agent到底是Hermes、Codex,还是Claude Code?我的选择是,都要,但分工不同。Hermes更适合做我的IM入口和长期调度层。我在手机上配置了快捷键,按一下就能打开飞书,飞书里对接Hermes。它适合长期任务,多群组多会话。所以它很适合做计划,再通过tmux控制Codex或者子Agent派发出去执行。所以没有必要在它们之间二选一。买Coding Plan和订阅Max20最大的爽点,不就是可以尽情尝试不同的Agent,并保留各自好用的点吗?就像买手机壳一样。在预算允许的情况下,我买它个四五种不同材质换着用,岂不美滋滋。

@ 作者 / 卡尔

© 版权声明

相关文章