什么是AI智能体?

原文:https://www.zhihu.com/question/660889662/answer/3555596662

作者:人人都能用好AI​(https://www.zhihu.com/people/renrenyongai

AI Agent是什么

现在 AI Agent 也没有完全统一的名称,比如 “AI 代理”、“智能代理”、“智能体” 等等叫法都存在,但是智能体是经常见到的一种叫法。

AI Agent(人工智能代理)的标准定义是:一种能够感知环境、进行决策和执行动作的智能实体。 不同于传统的人工智能, AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。

但是,必须要知道的是关于AI Agent的定义是有很多种的,主要是适用于不同的场景,比如机器人领域也有AI Agent的概念,与大语言模型领域的AI Agent的定义是不一样的。

在LLM语境下,Agent可以理解为某种能自主理解、规划决策、执行复杂任务的智能体。它不仅告诉你“如何做”,更会帮你去做。如果CoPilot是副驾驶,那么Agent就是主驾驶

AI Agent和对话式ChatAI的区别在于,你不用一直告诉它要做什么、如何做、怎么调整等等。只要给它一个目标,Agent自己就能想办法自动帮你完成。仅需给定一个目标,它就能够针对目标独立思考并做出行动,它会根据给定任务详细拆解出每一步的计划步骤,依靠来自外界的反馈和自主思考,自己给自己创建 prompt,甚至调用外部API,全自动的实现目标。

为什么需要AI Agent

很多人不禁会问,已经有很厉害的ChatAI了,为什么还需要AI Agent呢?但问题是,ChatAI真的在各种场景下都像你想象的那么厉害吗?

LLM有一些已知的缺点:

  • 会产生幻觉
  • 结果并不总是真实的
  • 对时事的了解有限或一无所知
  • 很难应对复杂的计算
  • 没有行动能力
  • 没有长期记忆能力

这个或许看上去很难理解,我们再举一个例子。
比如让 ChatAI帮忙买一杯咖啡,ChatAI 给出的反馈一般类似 “无法购买咖啡,我只是一个文字 AI 助手” 之类的回答。


那让我们来看一看,如果是一个买咖啡的AI Agent智能体,它应该怎样才能完成这个任务呢?
它需要首先拆解如何才能为你购买一杯咖啡,并制定出通过某个外卖 APP 下单、并采用某种在线支付方式等一系列计划,然后按照这些步骤调用 外卖APP选择外卖咖啡,再调用支付程序下单支付,过程无需人类去指定每一步操作。(这里请先忽略不同人选择不同外卖APP及不同支付方式的习惯


这就是 AI Agent 的用武之地,它可以利用外部工具来克服这些限制。这里的工具是什么呢?工具就是代理用它来完成特定任务的一个插件、一个集成 API、一个代码库等等,例如:

  • 搜索引擎:获取最新信息
  • Python REPL:执行代码
  • Wolfram:进行复杂的计算
  • 外部 API:获取特定信息

AI Agent是怎么工作的

一个精简的Agent决策流程,用函数表达式:

Agent:P(感知)—> P(规划)—>A(行动)

类似人类“做事情”的过程,Agent的核心功能,可以归纳为三个步骤的循环:感知(Perception)、规划(Planning)和行动(Action)

感知(Perception)是指Agent从环境中收集信息并从中提取相关知识的能力,规划(Planning)是指Agent为了某一目标而作出的决策过程,行动(Action)是指基于环境和规划做出的动作。

其中,Policy是Agent做出Action的核心决策,而行动又通过观察(Observation)成为进一步Perception的前提和基础,形成自主的闭环学习过程。

如何开发自己的AI Agent

开发AI Agent是一项技术工作,需要具备基础的软件技术知识和AI相关的知识。目前国内很多AI平台都推出了自己的AI Agent开发的功能。

例如,字节跳动推出的扣子(Coze)是一站式 AI Bot 开发平台,用户可以在该平台上快速搭建各类 AI 应用。在扣子平台中,通过创建 Bot、编写提示词、添加技能(如插件、工作流等)、设置开场白等步骤来构建智能体。

这些智能体具有一定的功能和逻辑,能够根据用户的输入进行响应和处理。例如,可以利用知识库回答问题,通过工作流实现复杂的业务流程等。也可以根据用户的需求和设置,具备不同程度的自主性和任务处理能力,以实现各种特定的应用场景和目标。

另外,智谱清言也支持创建自己的智能体。用户可零代码构建属于自己的智能体,如创建内容智能体,提供实时准确的行业信息、针对性内容创作、免费改写、查错等多功能应用。

支持在创建智能体时,选择一个模板作为智能体的基础。支持配置智能体属性如名称、描述、技能等。支持设定智能体行为,包括设置触发条件、响应动作以及与用户的交互方式等。根据实际应用场景去定制智能体的行为。支持智能体的训练、测试、与发布。

新推出多智能体协作系统——清言 Flow,可在同一个对话框中调用多种智能体协同工作,高效精准地解决思维导图、文档助手、日程安排等各种问题。

现在很多AI平台都支持智能体功能,我们将会在其它文章中详解各个平台的智能体功能。

发表评论

Comments

No comments yet. Why don’t you start the discussion?

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注