Google 白皮书:AI 智能体入门完全指南
Google 发布了一份关于 AI 智能体的综合白皮书,作者包括 Alan Blount、Antonio Gulli、Shubham Saboo、Michael Zimmermann 和 Vladimir Vuskovic(2025 年 11 月)。这是一份 54 页的深度文档,本文提炼了其核心见解——一份从原型到生产级智能体系统的完整指南。 1. 从预测式 AI 到自主智能体 人工智能正在经历范式转变。多年来,AI 的重点一直是擅长被动、离散任务的模型:回答问题、翻译文本或根据提示生成图像。这种范式虽然强大,但每一步都需要人类的持续指导。 我们现在正见证一个范式转变:从只是预测或创建内容的 AI,转向能够自主解决问题和执行任务的新型软件。 智能体是语言模型的自然进化,使其在软件中变得真正有用。 1.1 什么是 AI 智能体? AI 智能体不仅仅是静态工作流程中的 AI 模型;它是一个完整的应用程序,能够制定计划并采取行动来实现目标。它结合了语言模型(LM)的推理能力与行动能力,使其能够处理单独模型无法完成的复杂多步骤任务。 关键能力:智能体可以自主工作,在没有人类逐步指导的情况下找出达成目标所需的下一步。 2. AI 智能体的四大核心组件 用最简单的术语来说,AI 智能体可以定义为模型、工具、编排层和运行时服务的组合,在循环中使用语言模型来完成目标。 2.1 模型(“大脑”) 核心语言模型或基础模型,作为智能体的中央推理引擎,处理信息、评估选项并做出决策。模型类型(通用、微调或多模态)决定了智能体的认知能力。 智能体系统是语言模型输入上下文窗口的终极管理者。 2.2 工具(“双手”) 这些机制将智能体的推理与外部世界连接起来,使其能够执行超越文本生成的操作。包括: API 扩展 代码函数 数据存储(如数据库或向量存储)用于访问实时、事实性信息 智能体系统允许语言模型规划使用哪些工具,执行工具,并将工具结果放入下一次语言模型调用的输入上下文窗口。 2.3 编排层(“神经系统”) 管理智能体操作循环的治理流程。它处理: 规划 记忆(状态) 推理策略执行 这一层使用提示框架和推理技术(如思维链 Chain-of-Thought 或 ReAct)将复杂目标分解为步骤,并决定何时思考 vs 何时使用工具。这一层还负责给智能体"记忆"的能力。 2.4 部署(“身体和腿”) 虽然在笔记本电脑上构建智能体对原型设计很有效,但生产部署才是使其成为可靠、可访问服务的关键。这涉及: 在安全、可扩展的服务器上托管智能体 与监控、日志记录和管理的基本生产服务集成 通过图形界面供用户访问 通过 Agent-to-Agent (A2A) API 供其他智能体程序化访问 3. 智能体问题解决的五步循环 智能体在连续的循环过程中运作以实现目标。虽然这个循环可能变得高度复杂,但可以分解为五个基本步骤: ...