💡 大家好!我是卫星,二娃宝爸,90后大龄码农一枚,前大厂架构师。
💡 专注AI 领域深度探索,AI 提示词、AI 智能体、AI 副业内容分享。
💡

今天来和大家聊一个当下科技领域特别火爆的概念——AI Agent!

比尔·盖茨在其个人网站上发表了一篇题为《AI 将彻底改变计算机使用方式》的文章写到:AI Agent 不仅会改变每个人与计算机的交互方式,还将颠覆软件行业。

图片

他认为,AI Agent 将改变我们与计算机的交互方式,并将成为计算机领域自图形用户界面以来最大的变革。

他还预言“Android、iOS和Windows都是平台,AI Agent将成为下一个平台”。

图片

那到底什么是AI Agent?这东西和我有啥关系啊?请继续往下看。

1. 什么是AI Agent

OpenAI 将AI Agent定义为“以大语言模型为大脑驱动的系统,具备自主理解、感知、规划、记忆和使用工具的能力,能够自动化执行完成复杂任务的系统。”

AI Agent(人工智能代理)是一种基于人工智能技术的计算系统,能够自主执行特定任务,通常通过感知环境、处理信息、做出决策并采取行动来达到某个目标。

以下是AI Agent的一些关键特征:

1)感知能力:AI Agent能够通过传感器或接口获取环境中的信息,比如读取数据、接收用户输入或从网络获取实时信息。

2)决策与推理:根据感知到的信息,AI Agent 能够使用规则、逻辑推理、机器学习或深度学习算法来分析数据,做出决策。这种决策过程可以简单,也可以涉及复杂的统计、预测或优化计算。

3)自主行动:一旦做出决策,AI Agent 能够采取自主行动,例如发送消息、控制设备、生成内容、执行交易或与用户互动。

4)学习能力:许多AI Agent具备自我学习的能力,能够通过机器学习或其他算法,不断改进自身的表现和决策能力,尤其是在面对新的或变化的环境时。

5)交互性:AI Agent 还能够与人类或其他AI系统进行交互,通常通过自然语言处理或其他形式的界面。

说得通俗一些就是:大多数时候你给它一个最终你想要达成的目标,它能直接交付结果,过程你啥都不用管。

图片

2. AI Agent与LLM是什么关系

LLM大模型是AI Agent实现的前提和基础。

当下的LLM大模型可能存在一些缺陷:

  • 由于训练数据的时效性,导致大模型无法回答训练数据日期之后的知识
  • 由于大模型使用的是公开数据,针对企业私有数据的问题,无法进行回答
  • 由于上下文(Token)的限制,无法处理长文本
  • 由于产生幻觉、结果不总是真实可靠,或者对最新时事的了解有限

这些缺陷使得LLM大模型在处理复杂任务时可能显得力不从心。

AI Agent 的出现则是为了解决这一问题,AI Agent 通过集成自主验证和决策过程,能够弥补这些不足,确保行动的准确性和效率。

我们可以把AI Agent与LLM形象地比作生物体与其大脑,AI Agent有手有脚,可以自己干活自己执行,而LLM,就是它的大脑。

举个栗子,你的厨房有个AI厨师 —— AI Agent。

  • 如果只用AI大模型,它可能只能给你输出一份食谱,告诉你需要哪些食材和步骤来制作一道菜。
  • 而使用AI Agent,它不仅能提供食谱,还会根据你的口味偏好和营养需求,帮你选择最合适的食材,甚至能够自动下单购买,监控烹饪过程,确保食物的质量和口感,最终为你端上一份色香味俱佳的佳肴。

3. AI Agent是如何工作的

AI Agent的架构是其智能行为的基础,它通常包括感知、规划、记忆、工具使用和行动等关键组件,这些组件协同工作以实现高效的智能行为。

AI Agent 的核心公式:AI Agent = LLM(大模型) + Planning(规划) + Memory(记忆) + Tools(工具)

大模型更准确的表述:LLM(大模型+提示词)图片

我们也可以认为 LLM + Planning + Memory 是人类的大脑,而 Tools 则是人类的四肢。

还是拿上面厨师做菜例子来讲:

  1. LLM(大模型+提示词):就像厨师的大脑。

  2. Planning(规划):就是整个做菜的流程:确定菜谱、选材、备料、开锅、翻炒、起锅等等,俗称工作流。

  3. Memory(记忆):这类似于厨师脑子里的菜谱制作流程。

  4. Tools(工具):比如锅具。

4. AI Agent有哪些实际应用

分享金句图文卡片助手与ChatDev的创新探索两个优秀案例。

例一:金句图文卡片助手

图片

体验地址:https://www./s/ihGkV4Xc/

例二:ChatDev

图片

图片来自论文《ChatDev: Communicative Agents for Software Development》

由清华大学携手北京邮电大学及布朗大学共同开发的创新项目——ChatDev。这是一家只有AI Agent员工的软件开发公司,实现了由大模型驱动的AI全流程自动化软件开发。

在这个平台上,AI员工们自主地从用户需求出发,通过智能对话窗口,由CEO Agent领衔,将任务细化并指派给CTO、CPO、Designer、Programer、Tester、Reviewer等各种AI Agent的角色。

未来做软件产品的链路将极大被缩短。人类需要做的就是监督+决策,想想都让人激动~

比尔·盖茨的个人网站文章地址:https://www./AI-agents

图片

Hey,大家好!我是卫星,二娃宝爸,90后大龄码农一枚,前大厂架构师,现自由职业者。专注于AI 提示词、AI 智能体、AI 副业内容分享。我的愿景是让一部分人先了解AI、入门 AI。

你「在看」吗,点个「在看」吧?👇

图片

#artContent img{max-width:656px;} #artContent h1{font-size:16px;font-weight: 400;}#artContent p img{float:none !important;}#artContent table{width:100% !important;}