人工智能智能体的五个层次

语言 Chinese, Simplified

SEO Title

Five Levels Of AI Agents

介绍

这是一个我非常喜欢研究的话题，我很期待写这篇文章。主要是因为我想解开智能体的概念以及智能体的确切构成。

我想一起在特定领域的实现和被称为AGI的广泛的通用实现之间创建一个清晰的划分。

考虑到特定领域的实现，这是我最感兴趣的领域，这一类别需要考虑可用的构建工具、成本、延迟以及实际和商业影响。所有这些我都试图在这篇文章中涵盖。

领域注意事项

关于AGI或人工超级智能（ASI）以及组织正在策划的事情，有很多炒作、散布恐惧和猜测。这不是我的主要兴趣，而是如何利用LLM和自主人工智能智能体的力量在组织中实现特定领域。

Conversational UI的主要商业驱动力是银行、零售、金融服务等领域的公司，它们创建了基于人工智能的UI，供用户就产品和服务进行交互。

任何能够感知其环境并执行行动的实体都可以被视为智能体。

我们目前在哪里？

考虑到窄域实现，我们目前处于第二级和第三级；最有可能在2.5级。

LangChain在创建智能体开发框架方面处于领先地位。DSPy在LLM和LLamaIndex编程中的应用及其智能体RAG方法。

这些智能体人占熟练成年人的50%至90%，具有战略任务自动化能力。基于用户输入，智能体可以分解用户描述，规划子任务，并以有序的方式执行这些任务，以得出结论。

这些智能体能够在中间子任务上迭代，直到得出结论性的答案。

实际示例

考虑以下问题？

谁被视为iPhone之父？他的出生年份的平方根是多少？

这是一个相当模糊和复杂的问题，需要遵循几个步骤才能得出答案。有一个数学任务和结束，但也需要检索知识来回答问题。

对于这个实际示例，智能体有一些操作可供其使用：

LLM数学，
以下是SerpApi网站的截图。SerpApi使从搜索引擎结果中提取数据变得可行。
GPT-4（GPT-4–0314）。

下面，考虑这个基于LangChain的智能体的输出，并注意到智能体是如何以顺序的方式从思想到行动再到观察的，直到它得出最终答案并完成链。

以下是智能体事件序列的图形描述。

在显示五个级别的智能体的表中，您会注意到一级智能体是基于规则的…基于规则的智能体可以具有一定的自主权，但在实践中，它们由基于预定义步骤执行的预定义步骤组成。

下图显示了使用Generative AI节点构建智能体的更基于规则的方法。在本文的后面，我将更深入地研究为什么基于规则的自动化和可衡量的自治是企业实现的一种精明方法。适用于完全自主的智能体方法。

窄域智能体的基本结构

Agent的主干是大型语言模型（LLM）。智能体还可以访问许多工具。工具可以具有特定的功能，如网络搜索、特定的API、RAG、数学等等。

工具是用自然语言描述的，以便智能体知道在流程的特定阶段使用哪种工具。工具的数量和功能决定了智能体的功能有多强大。

实际注意事项

再次考虑Agent的窄域实现，需要记住一些实际注意事项。

感觉的

目前，大多数智能体都是虚拟的，通过语音或文本输入进行访问。这些智能体人可以推理并得出结论，然后通过语音或文本做出回应。可以添加多模式元素，其中智能体可以接收图像或视频作为输入，或者生成图像或视频用作输出。

然而，智能体通常不具备视觉、触觉、运动等其他感官能力。随着机器人技术的发展，将智能体与感官/身体能力相结合将迎来一个新时代。

LLM骨干

正如我前面提到的，智能体的主干是LLM，或者更具体地说是LLM API，它被调用。智能体要经过多次迭代和API调用。有一个单一的依赖性需要满足，因此我认为任何生产智能体实现冗余都必须构建到智能体主干中。

自托管LLM或本地推理服务器是确保正常运行时间的最佳方式。

费用

考虑到向智能体提出的每个问题都会多次查询LLM，因此使用商业LLM API的成本将非常高。

想象一下，成千上万的用户只会加剧成本问题。

延迟

会话系统需要亚秒的响应，任何复杂的系统，比如需要在内部为每次对话执行多个步骤的智能体，都会增加用户所经历的总延迟。

这可能成为一个需要克服的挑战。

未得出结论

需要注意的是，目前存在智能体人没有得出结论或过早得出结论的情况。如果用户可以访问并查看智能体的推理步骤，则用户的查询可能会通过智能体推理中的中间步骤来满足。用户可以停止智能体并通知它已经提供了足够的信息。

工具和成本

智能体需要访问工具才能执行任务。可以有一个完整的市场，在那里可以创建共享的工具。制造商不需要从头开始创建工具，而是选择现有工具。

这些工具可以是免费的，也可以是收费的；工具可以访问收费的API。

智能体术语

随着人工智能的发展，智能体一词被用来描述表现出智能行为并具有以下能力的实体：

自治
反应性，
积极性，以及
社交互动。

20世纪50年代，Alan Turing引入了标志性的图灵测试，这是人工智能中的一个关键概念，旨在研究机器是否能表现出与人类相似的智能行为。这些人工智能实体通常被称为智能体，奠定了人工智能系统的基础组件。

迁移学习

迁移学习包括利用从一项任务中获得的知识，并将其应用于另一项任务。

基础模型通常遵循这种方法，其中模型最初针对相关任务进行训练，然后针对感兴趣的特定下游任务进行微调。

迁移学习是一个强大的概念，它增加了模型的多功能性，在过去的学习基础上可以执行前所未有的任务。

结论

不知怎的，我觉得它目前被忽视了，但自主人工智能智能体代表了技术的一个关键进步。

配备了人工智能的智能体有能力：

独立操作，
做出决定&
在没有持续人为干预的情况下采取行动。

未来，自主人工智能将彻底改变从医疗保健、金融到制造和运输等行业。

然而，在决策过程中也考虑到问责制、透明度、道德操守、责任和偏见。

尽管存在这些挑战，但自主人工智能智能体的未来前景广阔。随着技术的不断发展，这些智能体将越来越多地融入我们的日常生活。

本文地址

https://architect.pub

登录发表评论
218 次浏览

发布日期

星期四, 五月 16, 2024 - 22:25

最后修改