人工智能代理如何工作？- 雪兽软件

文章发表于2026-03-17 14:00:43，归属【科技前沿】分类，已有182人阅读

人工智能代理已成为生成式 AI 的最新演进形态，它通过实现自动化功能来体现商业价值。

2022 年末，随着 OpenAI 的 ChatGPT 问世，生成式人工智能（生成式 AI）突然闯入科技领域，企业迅速接纳了它在自动化任务方面的潜力，例如答复客户咨询、处理售后工单以及生成内容。

一大批竞品聊天机器人紧随 ChatGPT 之后出现。但它们往往是静态工具；不会从用户交互或应用集成中学习。只有其底层的大语言模型（LLM）可以被训练。

人工智能代理应运而生。通过利用机器学习、自然语言处理（NLP）等技术，人工智能代理可以独立运行，甚至与其他智能体协作完成复杂任务。

麦肯锡公司在一份报告中解释道：“可以把它们看作能够完成复杂工作流的虚拟同事。这项技术有望带来新一轮生产力与创新浪潮。”据报告统计，93% 的 IT 领导者计划在两年内引入自主 AI 智能体 —— 近半数已经部署。

与聊天机器人一样，人工智能代理早在 20 世纪 60 年代就已存在。然而，直到人工智能、机器学习、深度学习以及 Transformer 模型（如 GPT‑3 和 ChatGPT）取得进展，它们才具备适应任务并从数据中学习的能力。这极大地拓展了其应用场景。

人工智能代理系统通常以基于 Transformer 的大语言模型为核心，并通过推理、记忆、强化学习和工具集成进行增强。大语言模型对语言的理解使其能够解读指令并生成回应。

简单来说，人工智能代理是大语言模型与传统软件应用的结合体，能够独立行动以完成任务。它们可以自主运行、做出决策、制定计划并采取行动以实现特定目标，无需持续的人工监督。

安永技术咨询团队负责人萨姆塔・卡普尔表示：“这是一种交付商业价值的方式，我认为重点应该放在思考你将如何颠覆业务流程。”

例如，如果员工申请休假，人工智能代理可以自动将请假日期录入人力资源系统，并确保所有其他系统知晓该员工将在指定时间离岗。卡普尔说，如果员工改变主意并输入新日期，智能体可以自主在人力资源系统中重新安排所有事项。只需一组简单指令，人工智能代理就会开始执行。

人工智能代理还可以自主编写软件代码，并将基础代码提供给开发人员，开发人员可检查其准确性并在必要时修改。但也存在能够执行代码审查的智能体。最棒的是，这一切都可以在几秒内完成，而非数小时或数天。

AI 辅助代码生成工具在软件工程中日益普及，并且有些出乎意料的是，它们已成为大多数尝试生成式 AI 工具的企业唾手可得的突破口。采用率正在飞速增长，因为即便它们只为新应用提供基础代码，自动化工具也能省去原本用于手动编写和更新代码的大量时间。

根据高德纳研究公司的数据，到 2027 年，预计 70% 的专业开发人员将使用 AI 驱动的编码工具，而 2023 年 9 月这一比例还不到 10%。高德纳称，三年内，80% 的企业将把 AI 增强测试工具集成到其软件工程工具链中。

除编码之外，人工智能代理还被设计为感知周围环境、基于信息做出决策、采取行动，并有时会随着时间学习和适应，从而自主完成任务。强化学习是人工智能代理在执行任务时不断提升复杂度的关键。

卡普尔说：“如果你在玩游戏，要么赢要么输。如果输了，你会回头分析原因，然后换种方式重新开始。对于人工智能代理，你会为它设定一组非常明确的关键绩效指标，因此它会知道自己是否达标。然后它会回溯并自我强化，以不同方式完成任务。”

感知 — 思考 — 行动流程与代理类型

古鲁拉詹表示，人工智能代理遵循循环的感知 — 思考 — 行动流程，步骤如下：

1. 感知：系统从环境或用户处获取输入。

2. 推理与规划：智能体的核心 “大脑”（通常是强大的大语言模型）对任务进行推理，生成并评估可能的行动。

3. 决策：强化学习策略（通常辅以人类反馈和过往交互记忆）帮助选择最优行动。

4. 执行：执行选定行动，可能通过 API 集成调用内部 / 外部工具。

5. 反馈循环：评估结果并用于优化未来决策，形成持续学习过程。

根据任务复杂度，可以使用多种类型的人工智能代理，包括：

1. 反应式代理：仅基于预设规则对环境做出响应。不存储历史或从经验中学习。作为最基础的智能体，它们用于客服机器人或可自动调节的智能家居设备。

2. 慎思式代理：使用内部模型和推理做出有依据的长期决策。应用于自动驾驶车辆、供应链管理和医疗决策系统等领域。

3. 混合式代理：结合上述两种方法，实现更高效的决策。例如，机器人可以对即时障碍做出反应，同时规划通往目标的路径。混合 AI 用于业务任务自动化，反应式智能体处理常规操作（如回复邮件），慎思式智能体则长期规划并优化工作流以提升效率。

简而言之，混合式代理在决策中同时整合即时反应与深思熟虑的规划。

古鲁拉詹说：“传统人工智能—— 或预测性人工智能—— 通常旨在解决特定的问题，例如预测存储系统中的硬盘故障。人工智能代理更具动态性；它能够适应、推理和制定策略。”

例如，想象一下，代理管理数据存储系统：监控仪表盘、识别瓶颈、预测故障，并主动采取措施预防错误，确保满足系统服务等级协议。

古鲁拉詹表示，以 NetApp 为例，其基于目标（如最大化正常运行时间或最小化能耗）建立奖励模型，结合人类偏好、实时数据和指令，使 AI 能够优化行为并随时间提升性能。

思维链提示（模仿人类思维）或 ReAct 提示等推理技术有助于拆解任务并规划行动。记忆模块存储上下文和中间结果，用于需要连续性的任务。结合人类反馈的强化学习微调系统输出，使其与人类价值观保持一致。此外，工具集成使 AI 能够执行文本生成之外的复杂任务，如网络搜索和 API 交互。

API 集成的日益普及

与人工智能代理结合的 API 集成目前是最顶尖的应用场景。在人工智能代理中，通过 API 集成提供的工具让智能体能够与现实世界交互。当任务需要外部信息时，智能体生成 API 调用、格式化参数、进行身份验证并处理响应，以完成任务或采取进一步行动。

古鲁拉詹说：“当智能体需要执行需要外部信息的任务时，例如搜索数据库、发送邮件、运行另一个机器学习模型，它会基于对任务和 API 文档的理解生成 API 调用。”

他解释道，执行 API 调用涉及使用正确参数格式化内容并进行身份验证，随后 API 返回数据（或执行操作）；智能体处理响应并完成任务，或在需要时采取后续行动。

古鲁拉詹表示，展望未来，人工智能代理仍需改进，例如解决 API 可发现性与适配性挑战，以及处理标准化和文档缺乏等问题。

变更管理也使智能体难以选择正确的 API。而 API 安全与身份验证至关重要，需要稳健的协议和访问控制来保护敏感数据。实施服务级凭证可以提供更细粒度的控制，例如将智能体限制为只读权限或特定操作。

目前有关智能体的新兴研究包括多目标优化，专注于使用基于目标的编程解决冲突的任务目标。此外，可以创建系统级启发式规则，作为反映核心原则、约束或安全措施的通用规则。

启发式规则可通过以下方式融入智能体框架：（1）过滤目标（如删除需要受限数据的目标）（2）修改目标（确保安全优先于效率）；（3）集成强化学习。

展望未来，智能体需要能够自主创建自己的 API 来完成任务，因为目前大多数智能体依赖预先存在的 API。古鲁拉詹说：“这将是迈向通用人工智能（AGI）的关键一步。”