还想通过发新模型来控评,那被封7次号的封号斗罗的我必重拳出击。这两天新尝试了一种方法开新号,也做一个新的skill,名字叫搭子。要是之后只能通过API来调用Claude模型的时候,怎么最大化利用额度,让Codex或者其他模型分摊掉一部分活。
🔗github. com/LearnPrompt/partner-skill我们先来光速回顾一下这两天都发生了什么,先是Anthropic的封号邮件加地址追踪这个问题,大家可以用一个叫做thunderbird的邮件客户端,它是开启了自动防护追踪的。也可以跟我一样,我的新方法就是用一台iPhone登录北美Apple ID,通过Apple ID的「隐藏邮件地址」功能生成一个全新邮箱,用这个邮箱注册Claude,最后通过礼品卡订阅。不需要手机号,不需要Google账号。如果账号被封,还可以通过苹果把钱退回来。至少,不让Anthropic赚这钱。还有就是Claude Code偷偷通过时区和代理域名来识别中国用户的骚操作,

传统的套路是IP检测,IP在哪个地方,Anthropic就觉得你是哪里的用户。但Claude Code这次不看IP了,看的是操作系统里的时区和ANTHROPIC_BASE_URL环境变量。时区好解决,手动改一下系统语言和时区就行。但环境变量就比较难办了。只要你是通过中转站用的Claude,base_url就要换成中转站的地址。Claude Code拿到这个地址,会跟它收集到的各种已知中转站地址、国内大厂内网地址做比对。然后,通过隐写术(Steganography),把这些信息包装成一个肉眼看不出任何区别的日期格式,悄悄传回服务器。。。按A社顶不住压力的说法,他们在7月2号的Claude Code新版本里会把这个检测代码删掉。坏消息是,他们同时部署了更强的缓解措施。所以现在基本是二选一,开一个新号,或者期待常用的中转站别挂。毕竟我是个被封过七个账号的人了。这次选择了极限开局,新号和API我都要。当然新号也是有被封的概率的,我现在能够想到他们新方式的核心,应该还是会围绕我们用Claude的方式,希望不会有更新的骚操作吧。如果Anthropic觉得你不是在正常使用,它一样会封你的号。之前我就试过用手机登录了一次Claude,第二天就被封了,有一次是凌晨在用,估计是时区的问题被封的。还有一次我终于从Plus一步步升级到Max,因为刚升级的那天就把5小时的额度打满了,第二天又被封了。所以这次看看这个号能活多久吧,这已经是我最大程度能做的努力了,实在不行熬过这一周让我跟Fable5多聊几次也行,在7月7号之前,我们可以选择把一周额度的50%用在Fable5上,之后就只能用credit了。所以接下来这几天,能用Fable5的尽量用,先把量打满再说。Fable5有几个提示语模板是真好用的,我从Anthropic给开发者放出来的指南里提炼了一下,直接拿去用,第一个,/loop查询长时间运行的目标,
/loop 15 分钟,检查我的构建是否通过,如果失败则通知我。
背景:我在准备一篇给AI产品经理看的教程,主题是如何写出更好用的Agent提示词。用途:读者需要看完后能直接套用到自己的工作里,而不是只理解概念。请做:把下面这段英文提示词模板改写成更地道、更适合中文用户的版本。交付:给我1个通用模板、1个简洁版、2个真实使用示例。边界:不要逐字翻译,不要写得像论文,也不要加入原文没有的复杂框架。
每条经验单独存成一条记录,开头用一句话概括。只记录两类东西:1.被我纠正过、下次不能再犯的点2.已经验证有效、以后可以复用的方法每条记录要写清楚它为什么重要。不要记录仓库、文档或聊天记录里已经有的信息。如果已有相似记录,就更新旧记录,不要重复新建。如果后来发现某条记忆是错的,就删掉或标记废弃。
从Claude导出的JSON数据包中批量提取对话:解析conversations.json、zip包内嵌套的conversations/projects/design_chats,按内容量过滤空对话,按主题分类(工具/创作/设计/闲聊),导出为可读markdown,最后筛选出可复用的知识(个人画像、技术决策、风格规范)存入持久化memory。

新号能开多久不好说。如果有一天只能通过API用Claude,我想象过那个画面,说实话有点像在沙漠里找水喝。所以我给自己留了一条退路,分两个部分,一个是搞清楚Sonnet5到底值不值得用,另一个是和Fable5一拍即合做了搭子skill。先说Sonnet5。昨天Anthropic上了这个新模型,同时还带了一个新的Tokenizer,简单说,Tokenizer 就是把我们输入的文字先切成模型能读懂的小块,模型通过看这些小块来理解和生成内容。从API价格上看,Sonnet5变便宜了。但A社会是那么好的人吗?新Tokenizer切出来的token比之前多了,同样长的英文语句是上一代的1.4倍,用起来反而贵了。因为我基本上Opus起步,切回Sonnet4.6还不如用GPT5.5,所以我对比了一下几个基准,首先是SWE-bench Pro(编程),Sonnet5是63.2%,Sonnet4.6是58.1%
,Opus4.8是69.2%。多学科推理,Humanity’s Last Exam不用工具时,Sonnet5是43.2%,Opus4.8是49.8%,开了工具之后Sonnet5直接跳到57.4%,非常接近Opus4.8。计算机使用能力,OSWorld-Verified,Sonnet5是81.2%,Opus4.8是83.4%。

反正这两天用下来,Sonnet5确实是修复了Opus4.8常见的工具调用失败和思考时候卡住的问题,如果推理强度到了xhigh和max档的话,费用就跟Opus4.8差不多了。
搭子skill:我和Fable5一拍即合做的省钱搭子这个Skill的出发点就是一个很实际的焦虑。Claude Max Plan,$200一个月,等同于官方0.2折,每月可以消耗价值$10000的Token。如果只能走API,每一分钱都得花在刀刃上,就算走中转,质量好点的在消耗同样价值的Token上还是要多花7-8倍的价格,所以搭子skill的原理说起来很简单,就把Claude Code和Codex各自最擅长的事拆开来。Claude Code只负责贵的事,前期的头脑风暴和规划,UI和交互,还有最后的代码审查。Codex负责耗额度大但对模型能力要求没那么高的事,比方说从零建项目,浏览器自动化,长上下文代码实现等等等等,量大管饱。这两个Agent左脚踩右脚的循环优化,达到比纯用Claude更好的开发效果。

目前,我测试出来可以把成本降到原来的30%。这里有个比较反直觉的点。刚开始我以为省钱的关键是少用Claude,能不用就不用,实际上最贵的是直接让Codex直接去调用Claude Code的话,它基本上会用Claude -P当一次对话去完成。在一个长时间的Goal期间,Codex是完全有可能调用多次Claude Code的。这个时候每一次新建Claude对话都要重新读一次项目,重新理解我们开发的目标,重新建上下文。这才是真正在烧钱的地方。搭子解决的就是这件事,让同一个Claude Code会话贯穿「计划→实现→review」整个流程,不反复冷启动。

触发搭子,也就一句话,指定不同阶段会用到哪个Agent就行,
搭子!我要开发一个新的点子王skill,目标是把我的思路转成Goal提示语。先用ClaudeCode规划,让Codex实现代码,再交回ClaudeCode做UI优化
