文章发表于2026-03-17 14:00:43,归属【科技前沿】分类,已有7人阅读
人工智能代理已成为生成式 AI 的最新演进形态,它通过实现自动化功能来体现商业价值。
2022 年末,随着 OpenAI 的 ChatGPT 问世,生成式人工智能(生成式 AI)突然闯入科技领域,企业迅速接纳了它在自动化任务方面的潜力,例如答复客户咨询、处理售后工单以及生成内容。
一大批竞品聊天机器人紧随 ChatGPT 之后出现。但它们往往是静态工具;不会从用户交互或应用集成中学习。只有其底层的大语言模型(LLM)可以被训练。
人工智能代理应运而生。通过利用机器学习、自然语言处理(NLP)等技术,人工智能代理可以独立运行,甚至与其他智能体协作完成复杂任务。
麦肯锡公司在一份报告中解释道:“可以把它们看作能够完成复杂工作流的虚拟同事。这项技术有望带来新一轮生产力与创新浪潮。”据报告统计,93% 的 IT 领导者计划在两年内引入自主 AI 智能体 —— 近半数已经部署。
与聊天机器人一样,人工智能代理早在 20 世纪 60 年代就已存在。然而,直到人工智能、机器学习、深度学习以及 Transformer 模型(如 GPT‑3 和 ChatGPT)取得进展,它们才具备适应任务并从数据中学习的能力。这极大地拓展了其应用场景。
人工智能代理系统通常以基于 Transformer 的大语言模型为核心,并通过推理、记忆、强化学习和工具集成进行增强。大语言模型对语言的理解使其能够解读指令并生成回应。
简单来说,人工智能代理是大语言模型与传统软件应用的结合体,能够独立行动以完成任务。它们可以自主运行、做出决策、制定计划并采取行动以实现特定目标,无需持续的人工监督。
安永技术咨询团队负责人萨姆塔・卡普尔表示:“这是一种交付商业价值的方式,我认为重点应该放在思考你将如何颠覆业务流程。”
例如,如果员工申请休假,人工智能代理可以自动将请假日期录入人力资源系统,并确保所有其他系统知晓该员工将在指定时间离岗。卡普尔说,如果员工改变主意并输入新日期,智能体可以自主在人力资源系统中重新安排所有事项。只需一组简单指令,人工智能代理就会开始执行。
人工智能代理还可以自主编写软件代码,并将基础代码提供给开发人员,开发人员可检查其准确性并在必要时修改。但也存在能够执行代码审查的智能体。最棒的是,这一切都可以在几秒内完成,而非数小时或数天。
AI 辅助代码生成工具在软件工程中日益普及,并且有些出乎意料的是,它们已成为大多数尝试生成式 AI 工具的企业唾手可得的突破口。采用率正在飞速增长,因为即便它们只为新应用提供基础代码,自动化工具也能省去原本用于手动编写和更新代码的大量时间。
根据高德纳研究公司的数据,到 2027 年,预计 70% 的专业开发人员将使用 AI 驱动的编码工具,而 2023 年 9 月这一比例还不到 10%。高德纳称,三年内,80% 的企业将把 AI 增强测试工具集成到其软件工程工具链中。
除编码之外,人工智能代理还被设计为感知周围环境、基于信息做出决策、采取行动,并有时会随着时间学习和适应,从而自主完成任务。强化学习是人工智能代理在执行任务时不断提升复杂度的关键。
卡普尔说:“如果你在玩游戏,要么赢要么输。如果输了,你会回头分析原因,然后换种方式重新开始。对于人工智能代理,你会为它设定一组非常明确的关键绩效指标,因此它会知道自己是否达标。然后它会回溯并自我强化,以不同方式完成任务。”
感知 — 思考 — 行动流程与代理类型
古鲁拉詹表示,人工智能代理遵循循环的感知 — 思考 — 行动流程,步骤如下:
1. 感知:系统从环境或用户处获取输入。
2. 推理与规划:智能体的核心 “大脑”(通常是强大的大语言模型)对任务进行推理,生成并评估可能的行动。
3. 决策:强化学习策略(通常辅以人类反馈和过往交互记忆)帮助选择最优行动。
4. 执行:执行选定行动,可能通过 API 集成调用内部 / 外部工具。
5. 反馈循环:评估结果并用于优化未来决策,形成持续学习过程。
根据任务复杂度,可以使用多种类型的人工智能代理,包括:
1. 反应式代理:仅基于预设规则对环境做出响应。不存储历史或从经验中学习。作为最基础的智能体,它们用于客服机器人或可自动调节的智能家居设备。
2. 慎思式代理:使用内部模型和推理做出有依据的长期决策。应用于自动驾驶车辆、供应链管理和医疗决策系统等领域。
3. 混合式代理:结合上述两种方法,实现更高效的决策。例如,机器人可以对即时障碍做出反应,同时规划通往目标的路径。混合 AI 用于业务任务自动化,反应式智能体处理常规操作(如回复邮件),慎思式智能体则长期规划并优化工作流以提升效率。
简而言之,混合式代理在决策中同时整合即时反应与深思熟虑的规划。
古鲁拉詹说:“传统人工智能—— 或预测性人工智能—— 通常旨在解决特定的问题,例如预测存储系统中的硬盘故障。人工智能代理更具动态性;它能够适应、推理和制定策略。”
例如,想象一下,代理管理数据存储系统:监控仪表盘、识别瓶颈、预测故障,并主动采取措施预防错误,确保满足系统服务等级协议。
古鲁拉詹表示,以 NetApp 为例,其基于目标(如最大化正常运行时间或最小化能耗)建立奖励模型,结合人类偏好、实时数据和指令,使 AI 能够优化行为并随时间提升性能。
思维链提示(模仿人类思维)或 ReAct 提示等推理技术有助于拆解任务并规划行动。记忆模块存储上下文和中间结果,用于需要连续性的任务。结合人类反馈的强化学习微调系统输出,使其与人类价值观保持一致。此外,工具集成使 AI 能够执行文本生成之外的复杂任务,如网络搜索和 API 交互。
API 集成的日益普及
与人工智能代理结合的 API 集成目前是最顶尖的应用场景。在人工智能代理中,通过 API 集成提供的工具让智能体能够与现实世界交互。当任务需要外部信息时,智能体生成 API 调用、格式化参数、进行身份验证并处理响应,以完成任务或采取进一步行动。
古鲁拉詹说:“当智能体需要执行需要外部信息的任务时,例如搜索数据库、发送邮件、运行另一个机器学习模型,它会基于对任务和 API 文档的理解生成 API 调用。”
他解释道,执行 API 调用涉及使用正确参数格式化内容并进行身份验证,随后 API 返回数据(或执行操作);智能体处理响应并完成任务,或在需要时采取后续行动。
古鲁拉詹表示,展望未来,人工智能代理仍需改进,例如解决 API 可发现性与适配性挑战,以及处理标准化和文档缺乏等问题。
变更管理也使智能体难以选择正确的 API。而 API 安全与身份验证至关重要,需要稳健的协议和访问控制来保护敏感数据。实施服务级凭证可以提供更细粒度的控制,例如将智能体限制为只读权限或特定操作。
目前有关智能体的新兴研究包括多目标优化,专注于使用基于目标的编程解决冲突的任务目标。此外,可以创建系统级启发式规则,作为反映核心原则、约束或安全措施的通用规则。
启发式规则可通过以下方式融入智能体框架:(1)过滤目标(如删除需要受限数据的目标)(2)修改目标(确保安全优先于效率);(3)集成强化学习。
展望未来,智能体需要能够自主创建自己的 API 来完成任务,因为目前大多数智能体依赖预先存在的 API。古鲁拉詹说:“这将是迈向通用人工智能(AGI)的关键一步。”