Anthropic:多agent系统让性能飙升90%!

AI 知识库3个月前发布 辰星
721 0 0
博思AIPPT
哈喽呀各位,晚上好,我是辰星,专注于研究AI智能体AI提效,又来熬夜写文章了。这篇文章带大家来学习下Anthropic最新分享的多于多智能体构建的设计思路,算是从0到1构建一个强大多智能体的系统架构设计思路,说是Claude现在内置的那个DeepResearch功能。
若无必要,勿添实体。Anthropic肯定不会没事放着单智能体不用,非得去搞个复杂的多智能体。Anthropic直接拿结果说话,他们在内部评估中,设计了一个由最强的模型Claude Opus作为“领导”角色,多个由“蠢”一点的模型Claude Sonnet当“员工”的多智能体系统,结果性能比之单纯拿Claude Opus强了90+%之多!

一、为什么多agent如此有效?

先说说传统单Agent的痛点。想象你让AI做一个复杂的研究任务,比如”分析全球芯片供应链”——这就像让一个人同时当侦探、翻译、数据分析师和战略顾问。好家伙,逮着一个人往死里薅,就是天才也遭不住啊。结果往往是:AI要么像无头苍蝇乱撞,要么陷入”过度思考”的怪圈,把简单问题复杂化。而多agent就是不计成本,一个主agent负责规划派发任务就行了,有事就招个员工去干。那么代价呢?token用量会很高罢了(费钱)。
更惨的是,单Agent有个致命伤:上下文窗口限制。这就好比让一个人同时记住100本书的内容,还要从中找出关键信息。现实吗?不现实!所以单Agent经常出现”看到前面忘后面”的尴尬情况,就像你背单词时背了后面忘了前面一样,太痛了。多agent本质是让单个agent的思考上下文拆分到多个子agent里,大大让各个agent的记忆负担降低了。

二、多Agent系统:”分工协作”产生奇迹

多Agent系统的核心思想很简单:让专业的人做专业的事。

Anthropic:多agent系统让性能飙升90%!

在他们的系统中:

  • 主Agent就是个项目经理,负责制定战略,带头冲。
  • 子Agent就是打工人了,各自干自己不同方向的活。

举个栗子🌰:当被问到”找出标普500信息技术板块的所有董事”时:

  1. 主Agent会把任务拆解成”搜索公司名单””查找董事信息”等子任务;
  2. 子Agent A专门负责科技公司A的董事信息;
  3. 子Agent B同步处理科技公司B的数据;
  4. 最后主Agent整合所有结果,并且判断要不要再加点打工agent干活。
  5. 信息足够后,主agent会将所有发现交给一个专门的“引文Agent”(CitationAgent),确保所有结论都有据可查,最后生成带引用的完整报告。看来我们的主agent也是个打工的呀,最后还得是老板验收。
Anthropic:多agent系统让性能飙升90%!

这种并行处理的能力是非常可怕的。当多Agent系统成功找到正确答案时,单Agent还在慢悠悠地顺序搜索——差距就像高铁和绿皮火车一样!

四、多Agent系统的”超能力”场景

这种架构特别适合三类任务:

  1. 信息量爆炸的任务(比如分析100家公司财报),。
  2. 需要使用大量工具的任务(搜索+计算+图表生成),各个工具的使用相互独立就更好了,更方便派发给不同的子agent去执行。
  3. 探索性研究(没有明确答案的问题)。

不过也有局限:

  • 不适合需要严格共享上下文的任务(比如多人协作写代码),也就是合作类任务比较难,毕竟人与人之间都很难沟通,agent之间就更难达成一致了。
  • Token消耗量大,适合高价值任务,预算不够的得注意点。

五、Prompt工程十分重要!

让多个AI协同工作可不是简单开几个线程就行。智能体越多,合作成本越高,复杂度呈指数级增长。
早期版本遇到过不少“崩溃”瞬间,比如系统为了查”半导体短缺”,同时派50个子Agent满世界乱搜不存在的信息来源。

  • 像Agent一样思考:在控制台里观察Agent的工作流程,一步步观察它的行为,才能直观地发现问题所在,并针对性的改进Prompt。
  • 教会“领导”Agent如何描述子任务:要让主agent学会当管理。给子Agent的任务描述必须清晰,包括目标、输出格式、使用工具和任务边界等。简单的提出“去研究一下XX”是没用的,子agent直接破防摆烂给你看。
  • 根据任务复杂度弹性投入:在Prompt中明确规定不同难度任务的资源配比,避免杀鸡用牛刀。简单任务用1个Agent和少量工具,复杂研究再用10多个Agent。
  • 工具设计和选择至关重要:工具的描述必须清晰、有区分度,起码看到就知道工具是干啥的。同时要给Agent一些人类的“经验”类规则,比如“先看一遍所有可用工具再做啥”。
  • 让Agent自我改进:Anthropic创建了一个“工具测试Agent”。它会反复试用一个新工具,然后自动重写工具的描述文档,让后续的Agent能用得更顺手。结果是任务完成时间减少了40%。
  • 先宽后窄:让Agent像人类专家一样研究,先广泛查询了解全貌,再逐步缩小范围,而不是一上来就限定死了任务,结果啥也搜不到。
  • 引导思考过程:使用“思考模式”(extended thinking)让Agent把思考过程写下来。主Agent 用它来规划,子Agent用它来评估每一步的工具调用结果。
  • 并行工具调用:让主Agent 并行分派子Agent,再让每个子Agent并行调用工具,这两层并行直接将复杂查询的耗时减少了90%。

六、未来展望:AI的”复仇者联盟2.0″

虽然现在多Agent系统还有些”成长的烦恼”(比如调试复杂、部署麻烦),但潜力无限。咱不如想象一下未来的应用场景:

  • 异步架构:目前的系统采用同步模式,主代理必须等待所有子代理完成工作。未来的异步架构将允许代理间自主协调,某个子代理发现重要线索时可即时创建新的子任务,大幅提升效率。
  • 智能体生命周期管理:未来的系统将能动态创建、销毁和重组代理,根据任务需求实时调整团队构成,真正实现”因需而变”。
  • 跨领域协作:探索让多智能体系统与其他AI能力(如代码执行、图像生成)无缝集成,构建更强大的混合智能体。
  • 伦理与安全框架:随着系统能力增强,未来将投入更多资源构建安全护栏,确保研究结果既准确又有益。

多智能体系统代表了AI研究工具的一次革命。正如计算机从单机时代进入网络时代,AI研究工具也从单智能体走向多智能体协作。虽然技术挑战依然存在,但其在研究效率上的提升已初步显现。
对于企业和研究者而言,现在是了解和探索这一技术的好时机。从简单的多代理协作开始,逐步扩展应用范围,或许你也能发现下一个突破性的研究工具。正如一些测试用户反馈:”Claude帮我发现了连专家都没注意到的商业机会!”。或许这就是多Agent系统的魅力——它不是更聪明的单个AI,而是更强大的集体智慧。

往期文章

5分钟读懂RAG的原理,让AI学会做笔记高考结束后,夸克Agent赛博“张雪峰”10分钟帮你报志愿MCP和A2A尚在“幼儿园”。AI时代反而更需要学编程别再纠结“Agent”概念了,来看看怎么做出更好的Agent吧

❝🌟 都看到这里了,如果这篇内容对你有启发:① 点赞/在看/分享 支持原创,这对我真的很重要!!!② 点击「关注」🔔 获取每周AI前沿技术深度解析和AI资料大礼包③ 星标公众号⭐ 第一时间获取AI黑科技更新推送

谢谢你看我的文章,也祝你在AI时代能找到自己真正想要的生活。也可以链接我,领取之前我整理的AI相关的一些学习资源。

Anthropic:多agent系统让性能飙升90%!

© 版权声明

相关文章