AI Agent技术发展介绍

AI 知识库4周前发布 刀把
707 0 0
博思AIPPT
AI大模型发展迅速,我们接触最多的功能就是对话流或者Co-Pilot(副驾驶),所谓AI Agent,则专注于自主系统,可以在没有人为干预的情况下做出决策和执行任务。简单的说,我们还在依靠AI”辅助驾驶”,AI Agent马上就要自己开车了。
本文简单介绍一下,基于AI大模型的Agent技术的相关发展。

首先,什么是Agent?一种比较通俗的解释方式:拿写作文做例子,之前的大模型问答,类似考试写作文,不能修改,需要一口气从头写到尾,大模型本身的幻觉导致效果并不是很好。人们想到一种方法,就是让大模型自己去检查修改自己的生成结果,这样的生成质量会提高很多,也可以让大模型自己写提纲,自己搜集材料,自己写自己修改,这样的质量又提高了很多,这就是Agent的方式。如下图,就是一种基于大模型的Agent概念框架:

AI Agent技术发展介绍

来源:https://arxiv.org/pdf/2309.07864
从图中可以看到,除了核心的大模型能力,Agent技术扩展了大模型很多能力,同时随着模型能力的不断增强而不断进化。1.信息处理能力:随着大模型的能力进化,可处理的上下文窗口不断扩展,让大模型可以处理更多的信息。从文本扩展到音视频,多模态能力让大模型对于信息的处理能力不断增强。 2024 年 8 月 6 日,OpenAI宣布Structured Outputs功能在 API 中正式上线,从 GPT-4o 开始在 OpenAI 的最新大型语言模型中可用,极大扩展了大模型使用工具以及获取反馈过程中的结构化信息交互能力。2.推理/规划能力:CoT以及强化学习能力应用于大模型,提升了大模型推理以及规划的能力,使得大模型可以在”慢思考”中提升思考质量。OpenAI o1是OpenAI于2024年9月推出的专注于复杂推理任务的人工智能模型系列。该系列基于思维链强化学习技术开发。2024 年 12 月 20 日,OpenAI 宣布推出 OpenAI o3 模型和 o3-mini 模型。3.工具使用能力2023 年的 6 月,OpenAI 推出了“Function Calling”,是 OpenAI 自 GPT-3.5-turbo-0613 版本起引入的 API 扩展机制。模型可以通过规范化输入输出来使用外部工具。为了统一大型语言模型与外部数据源和工具之间的通信,Anthropic 公司于 2024 年 11 月推出MCP(Model Context Protocol 的缩写,即模型上下文协议)开放标准,让大模型使用外部工具的能力进一步增强。4.记忆/知识能力在传统的AI对话中,引入RAG,长短记忆等方式,扩展了大模型的记忆能力和知识获取的范围。
在以上技术发展的背景下,AI Agent的开发日渐成熟,相关产品不断出现。Operator 是 OpenAI 于 2025 年 1 月 23 日上线的一款 AI 智能体产品。以使用自身的浏览器浏览网页,并通过输入、点击、滚动等操作与网页进行交互,从而为用户执行任务。其中CUA(Computer-Using Agent)是Operator 背后的核心驱动能力,它结合了 GPT-4o 的视觉能力以及通过强化学习实现的高级推理能力。Deep Research 是 OpenAI 于 2025 年 2 月 3 日推出的面向深度研究领域的智能体产品功能。Deep Research 基于 OpenAI 的 o3 模型,能够在数十分钟内完成需要数小时的人工研究任务,适用于金融、科学、政策分析及消费决策等多个领域。
当然,对于Agent的开发,相关的模式和工具也不断出现,对于Agent应用的设计模式,可以参考以下资料。
LangChain:大模型应用开发框架,比较早的Agent开发框架,功能也比较完善。

https://www.langchain.com/

吴恩达关于四种 Agent 设计范式的演讲,详解了Agent开发的一些设计方式。

https://www.deeplearning.ai/the-batch/how-agents-can-improve-llm-performance/

中文版:Agent > GPT5?吴恩达最新演讲:四种 Agent 设计范式(通俗易懂版)

AI Agent技术发展介绍

来源:https://github.com/neural-maze/agentic-patterns-course
Anthropic的Agent开发指导:Building effective agents,来源于他们开发中的经验积累。

https://www.anthropic.com/engineering/building-effective-agents

https://github.com/anthropics/anthropic-cookbook/blob/main/patterns/agents/README.md

AI Agent技术发展介绍

2025 年 3 月 11 日,OpenAI Agent SDK 发布,辅助开发者进行Agent开发

https://github.com/openai/openai-agents-python

https://openai.github.io/openai-agents-python/

技术日新月异,时代风起云涌~~

© 版权声明

相关文章