从生成式 AI 到代理式 AI:现实检验
一、新闻概述
1. 标题
从生成式 AI 到代理式 AI:现实检验
2. 发布时间
2025 年 12 月 15 日
3. 来源
HackerNoon
4. 作者
Denis Prilepskiy(NTT Data 高级 IT 架构师,拥有 15 年以上企业架构和 AI 系统经验)
二、核心内容
1. 事件摘要
A. 主要内容
本文是关于企业代理式 AI 的五部分系列文章的第一篇,探讨了从生成式 AI 向代理式 AI 转型过程中的现实挑战和机遇。
B. 核心亮点
- 凌晨 3 点的警钟:自主 AI 代理在关键任务上停滞时的真实场景
- Gartner 预测:到 2027 年,超过 40% 的代理式 AI 项目将被取消
- 企业现状:仅 19% 的组织在代理式 AI 方面进行了重大投资
- 关键区别:生成式 AI 回答问题,代理式 AI 完成任务
2. 关键信息
A. 核心概念
- 生成式 AI:强大的预测引擎,擅长生成内容,但缺乏真正的自主性
- 代理式 AI:具备内置决策循环,能够主动制定并执行多步骤计划
B. 重要数据
- Gartner 调查:仅 19% 的组织在代理式 AI 方面有重大投资
- 失败预测:超过 40% 的代理式 AI 项目将在 2027 年前被取消
- 取消原因:成本上升、业务价值不明确、风险控制不足
C. 涉及技术
- ChatGPT、Bard、Microsoft 365 Copilot(生成式 AI 代表)
- 企业级 AI 代理系统
- 人类在环监督机制
- 沙箱环境和审批门控
3. 背景介绍
A. 前置版本
生成式 AI 在过去几年快速发展,但主要局限于内容生成和问答场景。
B. 相关上下文
企业对 AI 的期望从辅助工具转向自主代理,但实际部署中面临诸多挑战。
三、详细报道
1. 主要内容
A. 凌晨 3 点的现实检验
文章以一个全球银行运营中心的真实场景开篇:该机构六个月前部署了首个代理式 AI 系统,期望它能夜间自动运行。演示时效果出色,AI 代理端到端处理支持工单,乐观情绪高涨。但在深夜,同一个代理在关键任务上停滞,人工值班工程师不得不紧急干预。
这个场景捕捉了许多早期采用者面临的严峻现实。代理式 AI 不是魔法,要实现得好需要大量工作。
B. 生成式 AI 与代理式 AI 的核心区别
生成式 AI 系统接收输入(提示词或查询)并产生输出(文本、代码、图像等),本质上是强大的预测引擎,擅长生成内容,但缺乏真正的自主性。
Gartner 明确指出,当前的聊天机器人没有制定计划和采取行动的代理能力,它们通过预测最常见的词语组合来响应用户提示词,换句话说,它们不是代理式 AI 的例子。
相比之下,代理式 AI 具有内置决策循环。代理系统可以被赋予高层级目标,并将主动制定和执行多步骤计划来实现它,只需最少的人工指导。
C. Plan-Act-Observe-Reflect 循环
一个完全实现的智能代理观察其上下文(通过数据源、传感器或系统 API),规划行动路线,通过调用工具或触发流程来行动,然后观察结果并反思下一步做什么。
本质上,它在连续的 Plan-Act-Observe-Reflect(计划-行动-观察-反思)循环中运行,直到目标实现或时间耗尽。这种闭环自主性是代理式 AI 与普通聊天机器人的区别所在。
D. 实际应用场景示例
一个简单的说法:生成式 AI 回答,代理式 AI 完成。
例如,不仅仅是在被提示时生成月度报告,代理式 AI 可以被指示确保我们的网站始终更新最新产品信息。它会主动监控相关数据源,检测产品详细信息何时变化,然后自动更新网站内容,所有这些都不需要人工提示。
它会规划必要步骤(检查数据库-检测变化-生成更新文本-调用网站 API 发布内容),执行它们,观察更新是否成功,并在需要时调整。
这种端到端的自主性虽然尚处于萌芽阶段,但开始在企业试点中出现。
2. 技术细节
A. 系统架构对比
graph LR
subgraph Generative_AI["生成式 AI"]
A1[用户提示] --> A2[预测引擎]
A2 --> A3[内容输出]
end
subgraph Agentic_AI["代理式 AI"]
B1[高层目标] --> B2[Plan 计划]
B2 --> B3[Act 行动]
B3 --> B4[Observe 观察]
B4 --> B5[Reflect 反思]
B5 -->|未完成| B2
B5 -->|已完成| B6[目标达成]
endB. 风险控制机制
企业正在学习通过以下方式管理给 AI 更多代理权的风险:
- 沙箱环境
- 特定操作的审批门控
- 在完全放开这些数字同事之前的其他保障措施
C. 成熟度阶段
文章提到企业从基础自动化到真正自主权的成熟度阶段包括:爬行、行走、奔跑、飞翔。
3. 数据与事实
A. 行业现状
Gartner 2025 年 1 月的调查显示:
- 仅 19% 的组织表示在代理式 AI 方面进行了重大投资
- 超过一半的组织采取谨慎或观望态度
B. 失败预测
Gartner 预测,到 2027 年,由于以下原因,超过 40% 的代理式 AI 项目将被取消:
- 成本不断上升
- 业务价值不明确
- 风险控制不足
C. 概念验证困境
许多早期项目难以超越概念验证阶段。
四、影响分析
1. 行业影响
A. 技术趋势
- 从辅助工具向自主代理的演进是必然趋势
- 完全自主仍是一个理想目标
- 当前市场上有许多所谓的 AI 代理实际上只是带有一些脚本操作的聊天机器人
B. 竞争格局
- 早期采用者面临挫折
- 许多公司在将 AI 代理集成到实际工作流程中挣扎
- 一些公司在 AI 未能达到预期时甚至重新雇佣员工
C. 技术发展方向
- 真正的代理式 AI 仍处于早期阶段
- 部署代理式 AI 既是技术问题,也是组织变革问题
2. 用户影响
A. 企业用户
- 不必担心落后,大多数组织仍处于旅程的起点
- 关键是透过炒作,以开放的眼光看待代理式 AI
- 需要理解成熟度阶段以评估当前位置和安全推进方式
B. 技术团队
- 需要建立风险控制机制
- 需要设计人类在环的监督系统
- 需要从科幻梦想转向务实部署
C. 业务决策者
- 需要明确业务价值
- 需要评估成本与收益
- 需要建立适当的预期
五、各方反应
1. 作者观点
作者经历了挫折但仍然保持乐观。在过去一年中,看到企业团队从追逐科幻梦想转向专注于确实能交付价值的务实部署。
2. 行业分析
A. Gartner 观点
- 当前聊天机器人不具备制定计划和采取行动的代理能力
- 大量代理式 AI 项目将在 2027 年前被取消
- 大多数组织采取谨慎态度
B. 行业共识
- 代理式 AI 是未来方向
- 但当前处于早期阶段
- 需要务实的实施策略
六、相关链接
1. 系列文章
- 本系列是五部分文章的第一篇
- 下一部分将探讨企业从基础自动化到真正自主权的典型成熟度阶段
2. 参考资料
- Gartner 智能代理报告
- Gartner 2025 年代理式 AI 调查