Anthropic：多agent系统让性能飙升90%！

哈喽呀各位，晚上好，我是辰星，专注于研究AI智能体AI提效，又来熬夜写文章了。这篇文章带大家来学习下Anthropic最新分享的多于多智能体构建的设计思路，算是从0到1构建一个强大多智能体的系统架构设计思路，说是Claude现在内置的那个DeepResearch功能。
若无必要，勿添实体。Anthropic肯定不会没事放着单智能体不用，非得去搞个复杂的多智能体。Anthropic直接拿结果说话，他们在内部评估中，设计了一个由最强的模型Claude Opus作为“领导”角色，多个由“蠢”一点的模型Claude Sonnet当“员工”的多智能体系统，结果性能比之单纯拿Claude Opus强了90+%之多！

一、为什么多agent如此有效？

先说说传统单Agent的痛点。想象你让AI做一个复杂的研究任务，比如”分析全球芯片供应链”——这就像让一个人同时当侦探、翻译、数据分析师和战略顾问。好家伙，逮着一个人往死里薅，就是天才也遭不住啊。结果往往是：AI要么像无头苍蝇乱撞，要么陷入”过度思考”的怪圈，把简单问题复杂化。而多agent就是不计成本，一个主agent负责规划派发任务就行了，有事就招个员工去干。那么代价呢？token用量会很高罢了（费钱）。
更惨的是，单Agent有个致命伤：上下文窗口限制。这就好比让一个人同时记住100本书的内容，还要从中找出关键信息。现实吗？不现实！所以单Agent经常出现”看到前面忘后面”的尴尬情况，就像你背单词时背了后面忘了前面一样，太痛了。多agent本质是让单个agent的思考上下文拆分到多个子agent里，大大让各个agent的记忆负担降低了。

二、多Agent系统：”分工协作”产生奇迹

多Agent系统的核心思想很简单：让专业的人做专业的事。

在他们的系统中：

主Agent就是个项目经理，负责制定战略，带头冲。
子Agent就是打工人了，各自干自己不同方向的活。

举个栗子🌰：当被问到”找出标普500信息技术板块的所有董事”时：

主Agent会把任务拆解成”搜索公司名单””查找董事信息”等子任务；
子Agent A专门负责科技公司A的董事信息；
子Agent B同步处理科技公司B的数据；
最后主Agent整合所有结果，并且判断要不要再加点打工agent干活。
信息足够后，主agent会将所有发现交给一个专门的“引文Agent”（CitationAgent），确保所有结论都有据可查，最后生成带引用的完整报告。看来我们的主agent也是个打工的呀，最后还得是老板验收。

这种并行处理的能力是非常可怕的。当多Agent系统成功找到正确答案时，单Agent还在慢悠悠地顺序搜索——差距就像高铁和绿皮火车一样！

四、多Agent系统的”超能力”场景

这种架构特别适合三类任务：

信息量爆炸的任务（比如分析100家公司财报），。
需要使用大量工具的任务（搜索+计算+图表生成），各个工具的使用相互独立就更好了，更方便派发给不同的子agent去执行。
探索性研究（没有明确答案的问题）。

不过也有局限：

不适合需要严格共享上下文的任务（比如多人协作写代码），也就是合作类任务比较难，毕竟人与人之间都很难沟通，agent之间就更难达成一致了。
Token消耗量大，适合高价值任务，预算不够的得注意点。

五、Prompt工程十分重要！

让多个AI协同工作可不是简单开几个线程就行。智能体越多，合作成本越高，复杂度呈指数级增长。
早期版本遇到过不少“崩溃”瞬间，比如系统为了查”半导体短缺”，同时派50个子Agent满世界乱搜不存在的信息来源。

像Agent一样思考：在控制台里观察Agent的工作流程，一步步观察它的行为，才能直观地发现问题所在，并针对性的改进Prompt。
教会“领导”Agent如何描述子任务：要让主agent学会当管理。给子Agent的任务描述必须清晰，包括目标、输出格式、使用工具和任务边界等。简单的提出“去研究一下XX”是没用的，子agent直接破防摆烂给你看。
根据任务复杂度弹性投入：在Prompt中明确规定不同难度任务的资源配比，避免杀鸡用牛刀。简单任务用1个Agent和少量工具，复杂研究再用10多个Agent。
工具设计和选择至关重要：工具的描述必须清晰、有区分度，起码看到就知道工具是干啥的。同时要给Agent一些人类的“经验”类规则，比如“先看一遍所有可用工具再做啥”。
让Agent自我改进：Anthropic创建了一个“工具测试Agent”。它会反复试用一个新工具，然后自动重写工具的描述文档，让后续的Agent能用得更顺手。结果是任务完成时间减少了40%。
先宽后窄：让Agent像人类专家一样研究，先广泛查询了解全貌，再逐步缩小范围，而不是一上来就限定死了任务，结果啥也搜不到。
引导思考过程：使用“思考模式”（extended thinking）让Agent把思考过程写下来。主Agent 用它来规划，子Agent用它来评估每一步的工具调用结果。
并行工具调用：让主Agent 并行分派子Agent，再让每个子Agent并行调用工具，这两层并行直接将复杂查询的耗时减少了90%。

六、未来展望：AI的”复仇者联盟2.0″

虽然现在多Agent系统还有些”成长的烦恼”（比如调试复杂、部署麻烦），但潜力无限。咱不如想象一下未来的应用场景：

异步架构：目前的系统采用同步模式，主代理必须等待所有子代理完成工作。未来的异步架构将允许代理间自主协调，某个子代理发现重要线索时可即时创建新的子任务，大幅提升效率。
智能体生命周期管理：未来的系统将能动态创建、销毁和重组代理，根据任务需求实时调整团队构成，真正实现”因需而变”。
跨领域协作：探索让多智能体系统与其他AI能力（如代码执行、图像生成）无缝集成，构建更强大的混合智能体。
伦理与安全框架：随着系统能力增强，未来将投入更多资源构建安全护栏，确保研究结果既准确又有益。

多智能体系统代表了AI研究工具的一次革命。正如计算机从单机时代进入网络时代，AI研究工具也从单智能体走向多智能体协作。虽然技术挑战依然存在，但其在研究效率上的提升已初步显现。
对于企业和研究者而言，现在是了解和探索这一技术的好时机。从简单的多代理协作开始，逐步扩展应用范围，或许你也能发现下一个突破性的研究工具。正如一些测试用户反馈：”Claude帮我发现了连专家都没注意到的商业机会！”。或许这就是多Agent系统的魅力——它不是更聪明的单个AI，而是更强大的集体智慧。