智能体 | AI Craft

Google 发布了一份关于 AI 智能体的综合白皮书，作者包括 Alan Blount、Antonio Gulli、Shubham Saboo、Michael Zimmermann 和 Vladimir Vuskovic（2025 年 11 月）。这是一份 54 页的深度文档，本文提炼了其核心见解——一份从原型到生产级智能体系统的完整指南。 1. 从预测式 AI 到自主智能体人工智能正在经历范式转变。多年来，AI 的重点一直是擅长被动、离散任务的模型：回答问题、翻译文本或根据提示生成图像。这种范式虽然强大，但每一步都需要人类的持续指导。我们现在正见证一个范式转变：从只是预测或创建内容的 AI，转向能够自主解决问题和执行任务的新型软件。智能体是语言模型的自然进化，使其在软件中变得真正有用。 1.1 什么是 AI 智能体？ AI 智能体不仅仅是静态工作流程中的 AI 模型；它是一个完整的应用程序，能够制定计划并采取行动来实现目标。它结合了语言模型（LM）的推理能力与行动能力，使其能够处理单独模型无法完成的复杂多步骤任务。关键能力：智能体可以自主工作，在没有人类逐步指导的情况下找出达成目标所需的下一步。 2. AI 智能体的四大核心组件用最简单的术语来说，AI 智能体可以定义为模型、工具、编排层和运行时服务的组合，在循环中使用语言模型来完成目标。 2.1 模型（“大脑”）核心语言模型或基础模型，作为智能体的中央推理引擎，处理信息、评估选项并做出决策。模型类型（通用、微调或多模态）决定了智能体的认知能力。智能体系统是语言模型输入上下文窗口的终极管理者。 2.2 工具（“双手”）这些机制将智能体的推理与外部世界连接起来，使其能够执行超越文本生成的操作。包括： API 扩展代码函数数据存储（如数据库或向量存储）用于访问实时、事实性信息智能体系统允许语言模型规划使用哪些工具，执行工具，并将工具结果放入下一次语言模型调用的输入上下文窗口。 2.3 编排层（“神经系统”）管理智能体操作循环的治理流程。它处理：规划记忆（状态）推理策略执行这一层使用提示框架和推理技术（如思维链 Chain-of-Thought 或 ReAct）将复杂目标分解为步骤，并决定何时思考 vs 何时使用工具。这一层还负责给智能体"记忆"的能力。 2.4 部署（“身体和腿”）虽然在笔记本电脑上构建智能体对原型设计很有效，但生产部署才是使其成为可靠、可访问服务的关键。这涉及：在安全、可扩展的服务器上托管智能体与监控、日志记录和管理的基本生产服务集成通过图形界面供用户访问通过 Agent-to-Agent (A2A) API 供其他智能体程序化访问 3. 智能体问题解决的五步循环智能体在连续的循环过程中运作以实现目标。虽然这个循环可能变得高度复杂，但可以分解为五个基本步骤： ...