Page 26 · SimLabs LLM Visual

Agent:规划、执行、观察与记忆

如果 Tool Use 解决的是“模型能不能借外部能力做一件事”,那么 Agent 解决的是“面对多步目标时,模型能不能自己分解任务、逐步执行、观察结果并更新计划”。Agent 不是一次回答,而是一种循环工作的系统形态。

先定目标 再规划和执行 最后根据观察持续修正

换一个任务,看 Agent 是怎样循环工作的

切换任务后,再切换当前所处阶段。你会看到 Agent 在做什么决策、调用了什么能力、观察到了什么结果,以及这些结果怎样进入下一轮计划。

当前目标

当前子计划

正在执行的动作

观察与记忆

如果只做一次性回答

Agent 迭代后的交付

Agent 为什么比单轮问答更像“系统”

它有状态

单轮回答结束后通常就算完了,但 Agent 会保留当前计划、已完成步骤、失败原因和中间结果。

它会循环

Agent 不是“一次想完所有步骤”,而是做一步、看一步、再决定下一步,这和真实任务更接近。

它常常会用多个工具

一次任务里可能同时用到搜索、数据库、计算器、浏览器或代码执行器,而不只是单个 API。

它更依赖守护机制

因为 Agent 会自己决定下一步动作,所以权限控制、失败回退、观察校验就比普通问答更关键。

一个典型 Agent 循环的五步

1

明确目标

知道最终想交付什么,而不只是回答一句话。

2

拆计划

把复杂目标拆成当前最值得先做的几个步骤。

3

执行动作

调用工具、访问系统、写草稿、运行命令、搜索信息。

4

观察反馈

根据工具结果、失败信息或新证据更新当前判断。

5

更新并继续

修改计划、记录进度、直到满足交付目标。

常见误区: Agent 不是“套一个提示词就自动聪明了”。真正可靠的 Agent 通常需要任务边界、工具权限、状态管理和失败兜底一起配合。
一句话总结: Agent 让模型从“回答一次”变成“围绕目标持续行动、持续观察、持续修正”,这也是大模型系统进入真实工作流的重要一步。