跳转到主要内容
Chinese, Simplified

category

随着组织认识到这些技术尚未开发的潜力,将生成性人工智能代理集成到业务流程中的步伐将加快。多模态人工智能(AI)的进步将进一步拓宽其应用范围,智能体不仅可以理解和生成文本,还可以理解和产生图像、音频和视频。本文将讨论代理AI驱动的架构和实现方法。

近年来,在大型语言模型(LLM)和自然语言处理(NLP)的进步推动下,生成性人工智能代理的出现促进了人工智能领域的转型。Anthropic、Cohere和亚马逊等公司在开发强大的语言模型方面取得了重大进展,这些模型能够理解和生成跨多种模式的类人内容,彻底改变了企业在流程中集成和利用人工智能的方式。

这些人工智能代理表现出了非凡的多功能性,能够执行从创意写作和代码生成到数据分析和决策支持等任务。他们参与智能对话、提供情境感知响应和适应不同领域的能力彻底改变了企业解决问题、客户服务和知识传播的方式。

生成式人工智能代理最重要的影响之一是它们通过同步和异步模式增强人类能力的潜力。在同步编排中,就像在传统的流程自动化中一样,主管代理编排多代理协作,维护整个流程的高级视图,同时积极指导信息和任务的流动。这种方法允许企业以可控、可预测的方式卸载重复性和耗时的任务。

或者,异步编排遵循事件驱动模式,其中代理由系统中的事件或状态变化触发自主操作。在这个模型中,代理发布其他代理可以订阅的事件或消息,创建一个从他们的集体行为中产生的工作流。事实证明,这些模式在增强客户体验方面特别有价值,代理商可以提供全天候支持,及时解决问题,并通过精心策划或事件驱动的互动提供个性化建议,从而提高客户满意度和忠诚度。

代理AI架构

Agent AI架构是通过自主代理实现过程自动化向AI能力的转变,目的是模仿认知能力并增强传统自主代理的行为。这种架构可以使企业简化运营,增强决策过程,并以新的方式自动化复杂的任务。

与通过技术实现的传统业务流程自动化非常相似,代理人工智能架构是人工智能系统的设计,旨在通过有限或间接的人为干预来解决复杂的问题。这些系统由多个AI代理组成,它们通过一系列精心编排或编排的过程相互对话或执行复杂的任务。这种方法使人工智能系统能够表现出目标导向的行为,从经验中学习,并适应不断变化的环境。

单代理调用和多代理协作之间的区别在于过程中涉及的代理的复杂性和数量。

当你与Alexa等数字助理互动时,你通常会与一个单一的代理互动,也称为会话代理。此代理处理您的请求,例如设置计时器或检查天气,并在不需要咨询其他代理的情况下提供响应。

现在,想象一下将这种交互扩展到包括多个协同工作的代理。让我们从一个简单的旅行预订场景开始:

你的互动始于告诉旅行计划代理你想要的旅行。在第一步中,人工智能模型(在这种情况下是LLM)充当您的自然语言输入和旅行计划系统所需的结构化信息之间的解释器和用户体验界面。它正在处理您的请求,这可能是一个复杂的陈述,比如“我想计划下个月为我的四口之家在夏威夷度过一周的海滩假期”,并提取目的地、持续时间、旅行者数量和大致日期等关键细节。

LLM还可能推断出未明确说明的其他相关信息,例如需要家庭友好型住宿或活动。它可能会提出后续问题,以澄清模糊的点或收集更具体的偏好。从本质上讲,LLM正在将您的随意、对话式输入转化为一组结构化的旅行要求,供专业预订代理在工作流程的后续步骤中使用。

这种初始交互为整个多代理工作流程奠定了基础,确保旅行计划代理在与其他专业代理合作之前清楚地了解您的需求。

通过添加另一个代理,即航班预订代理,旅行计划代理可以调用它来寻找合适的航班。旅行计划代理需要向航班预订代理提供相关信息(日期、目的地),并等待和处理航班预订代理的回复,将航班选项纳入其总体计划

现在,让我们向工作流中添加另一个代理;支持寻找住宿的酒店预订代理。此外,旅行计划代理还必须与酒店预订代理沟通,酒店预订代理需要确保酒店日期与航班日期一致,并将信息反馈给总体计划,包括航班和酒店选项。

随着我们继续添加代理,如汽车租赁代理或当地活动代理,每个新添加的代理都会从旅行计划代理接收相关信息,执行其特定任务,并返回其结果以纳入总体计划。旅行计划代理不仅充当用户体验界面,还充当协调员,决定何时让每个专业代理参与进来,以及如何将他们的输入组合成一个有凝聚力的旅行计划。

这种多代理工作流允许通过利用每个代理的特定功能来完成更复杂的任务。该系统保持灵活性,因为可以根据每个请求的特定需求添加或删除代理,而不需要对现有代理进行重大更改,也不需要对整个工作流程进行最小的更改。

有关将任务分解为代理的更多好处,请参阅任务分解和较小的LLM如何使AI更经济实惠。

基于代理AI架构的流程自动化

与传统的流程自动化一样,前面的场景是一种常见的编排模式,其中多代理协作由监督代理编排。监督代理人就像指挥管弦乐队一样,告诉每种乐器何时演奏以及如何与其他乐器协调。对于这种方法,Amazon Bedrock Agents使生成式人工智能应用程序能够执行由代理编排的多步骤任务,并与Amazon Bedrock Agents创建多代理协作来解决复杂任务。这是通过将Amazon Bedrock代理指定为主管代理,将一个或多个合作代理与主管关联来实现的。有关更多详细信息,请阅读有关创建和配置Amazon Bedrock代理以及使用与Amazon Bedrock代理的多代理协作的内容。

下图说明了监督代理方法。

监督代理方法

遵循传统的流程自动化模式,同步编排的另一端将是异步编排:异步事件驱动的多代理工作流。在这种方法中,将没有中央编排代理(主管)。代理自主运行,其中操作由系统状态的事件或变化触发,代理发布其他代理可以订阅的事件或消息。在这种方法中,工作流来自代理对事件异步反应的集体行为。这更像是一种爵士乐即兴创作,每个音乐家在没有指挥的情况下对其他人的演奏做出回应。下图说明了此事件驱动的工作流。

事件驱动的工作流方法

异步系统中的事件驱动模式在没有预定义工作流的情况下运行,从而创建了一个动态且可能混乱的处理环境。当代理通过中央事件中心订阅和发布消息时,处理流程由消息要求和可用的订阅代理有机地决定。尽管可视化后产生的模式可能类似于结构化的工作流程,但重要的是要理解这是一种紧急行为,而不是精心策划的设计。没有集中的工作流定义意味着消息处理是基于发布时间和代理可用性自然进行的,从而创建了一个可以随着不断变化的需求而发展的流畅且适应性强的系统。

同步编排和异步事件驱动模式之间的选择从根本上决定了代理AI系统的操作和扩展方式。同步编排及其监督代理方法提供了精确的控制和可预测性,使其成为需要严格监督和顺序执行的复杂流程的理想选择。这种模式在需要严格管理、审核和调试工作流的场景中表现出色。然而,它可能会造成瓶颈,因为所有操作都必须通过监督代理。相反,异步事件驱动系统通过其分布式特性提供了更大的灵活性和可扩展性。通过允许代理独立操作并实时对事件做出反应,这些系统可以更容易地处理动态场景并适应不断变化的需求。虽然这种方法可能会在跟踪和调试工作流程中引入更多复杂性,但它在需要高可扩展性、容错性和自适应行为的场景中表现出色。这些模式之间的决定通常取决于系统的具体要求,在控制和可预测性的需求与灵活性和可扩展性的好处之间取得平衡。

充分利用这两种模式

您可以在运行时使用单个代理根据事件数据(消息)的上下文将消息路由到其他代理,而无需事先了解下游代理,也不必依赖订阅事件中心的每个代理。这传统上被称为消息代理或事件代理模式,为了本文的目的,我们将称之为代理代理模式,以表示向AI代理代理代理消息。代理代理模式是一种混合方法,它结合了集中式同步编排和分布式异步事件驱动系统的元素。

这种模式的关键在于,单个代理充当消息分发的中心枢纽,但并不控制整个工作流。代理根据每条消息的内容或元数据确定将其发送到何处,并在运行时做出路由决策。处理代理彼此之间以及与消息源解耦,只与代理交互以接收消息。代理代理模式与监督模式不同,因为它通过将消息路由到代理而不是等待响应来等待协作代理的响应。下图说明了代理代理方法。


Agent broker methodology

遵循代理-代理模式,系统仍然基本上是事件驱动的,动作由消息的到达触发。可以添加新的代理来处理特定类型的消息,而无需更改整个系统架构。本文稍后将解释如何实现这种模式。

这种模式通常用于企业消息传递系统、微服务架构和复杂事件处理系统。它在编排的工作流结构和纯事件驱动系统的灵活性之间提供了平衡。

采用Amazon Bedrock Converse API的代理架构

传统上,在向架构添加其他进程(代理)时,我们可能不得不更新代理中的路由逻辑,从而牺牲代理模式的一些灵活性。然而,当使用亚马逊Bedrock Converse API时,情况并非如此。通过Converse API,我们可以调用一个工具来完成Amazon Bedrock模型响应。唯一的变化是添加到作为配置存储在代理之外的协作中的额外代理。

为了让模型使用工具完成对消息的响应,消息和一个或多个工具(代理)的定义被发送到模型。如果模型确定其中一个工具可以帮助生成响应,它将返回使用该工具的请求。

AWS AppConfig是AWS Systems Manager的一项功能,用于将每个代理的工具上下文数据作为单个配置存储在托管数据存储中,以发送给Converse API工具请求。通过使用AWS Lambda作为消息代理接收所有消息并使用AWS AppConfig中存储的工具上下文向Converse API发送请求,该体系结构允许在不必更新路由逻辑的情况下向系统添加额外的代理,方法是在AWS AppConfig存储的配置中将代理“注册”为“工具上下文”,以便Lambda在运行时读取(接收到事件消息)。有关何时使用AWS Config的更多信息,请参阅AWS AppConfig用例。

实现代理-代理模式

下图展示了Amazon EventBridge和Lambda如何通过Amazon Bedrock Converse API作为中心消息代理,让模型在对话中使用工具,将消息动态路由到适当的人工智能代理。


Agent broker architecture

发送到EventBridge的消息通过EventBridge规则路由到Lambda。EventBridge Lambda函数作为代理代理执行三项任务:

  • 查询AWS AppConfig以获取所有代理的工具上下文。代理工具上下文是对代理功能的描述,以及代理消息入口的亚马逊资源名称(ARN)或URL。
  • 通过Converse API向Amazon Bedrock LLM提供代理工具上下文以及入站事件消息;在这个例子中,使用与Amazon Bedrock工具兼容的LLM。LLM使用Converse API,将事件消息上下文与代理工具上下文相结合,以提供对请求Lambda函数的响应,其中包含应用于处理消息的推荐工具。
  • 接收来自Converse API请求的响应,该请求包含应调用以处理事件消息的一个或多个工具,并将事件消息传递给推荐工具的入口。

在这个例子中,该架构演示了异步代理消息到基于Amazon SageMaker的代理、Amazon Bedrock代理和外部第三方代理,所有这些都来自同一个代理代理。

虽然代理Lambda功能可以直接连接到SageMaker或Amazon Bedrock代理API,但该体系结构提供了消息吞吐量的适应性和可扩展性,允许来自代理代理的消息排队,在本例中使用Amazon Simple Queue Service(Amazon SQS),并根据接收代理的能力进行处理。为了适应性,订阅到代理入口队列的Lambda函数提供了额外的系统提示(特定工具上下文的LLM预提示)和消息格式,以及代理请求的预期输入和输出所需的功能。

要向系统添加新代理,唯一的集成要求是使用新的代理工具上下文(代理功能和入口端点的描述)更新AWS AppConfig,并确保代理Lambda函数有权写入代理入口端点。

可以将代理添加到系统中,而无需重写需要停机的Lambda函数或集成,从而允许在代理Lambda函数的下一个实例化中使用新代理。

使用代理代理实现监督模式

基于代理-代理模式,该架构可以扩展以处理更复杂、有状态的交互。尽管broker模式有效地使用了AWS AppConfig和Amazon Bedrock的Converse API工具使用功能进行动态路由,但其单向性具有局限性。事件流入并分发给代理,但旅行预订等复杂场景需要在多个代理交互中维护上下文。这就是监督模式在不损害我们使用代理模式实现的灵活路由的情况下提供额外功能的地方。

以旅行预订代理为例:该示例有经纪人代理和几个基于任务的代理,事件将被推送到这些代理。在处理“在9月的第一周预订从墨尔本到悉尼的2人3晚旅行”这样的请求时,我们遇到了几个挑战。虽然此声明包含明确的意图,但它缺少代理可能需要的关键细节,例如:

  • 具体旅行日期
  • 住宿偏好和房间配置

仅凭代理模式无法有效地管理这些信息差距,同时保持代理交互之间的上下文。这就是在经纪人代理中添加主管功能的地方:

事件和代理调用之间的上下文感知

双向信息流能力

下图说明了主管模式工作流程

Supervisor pattern architecture

当新事件进入系统时,工作流将启动以下步骤:

  1. 为事件分配了一个唯一的标识符进行跟踪
  2. 主管执行以下操作:
    1. 评估要调用哪些代理(代理)
    2. 使用标识符和时间戳创建新的状态记录
    3. 向所选代理提供此上下文信息及其调用参数
  3. 代理处理他们的任务,并向EventBridge发出“任务完成”事件
  4. 主管执行以下操作:
    1. 收集和处理已完成的事件
    2. 评估综合结果和背景
    3. 确定是否需要其他代理调用
    4. 继续此循环,直到完成所有必要的操作

此模式处理代理可能返回不同结果或请求其他信息的情况。主管可以:

  • 从其他代理响应中获取缺失的信息
  • 向信息来源索取更多信息
  • 与其他代理协调以解决信息差距

为了在不修改架构的情况下处理信息缺口,我们可以在现有系统中引入一个应答代理。此代理与其他代理在相同的框架内运行,但专门从事上下文解析。当代理人报告信息不完整或要求澄清时,代理人可以:

  • 处理关于缺失信息的查询
  • 使用增强的上下文发送任务完成事件
  • 允许主管使用新的可用信息恢复工作流执行,就像在另一个代理发出任务完成事件后一样。

这种增强功能实现了复杂的多步骤工作流程,同时保持了系统的可扩展性和灵活性。主管可以管理代理之间的依赖关系,处理部分完成,并确保在完成任务之前收集必要的信息。

实施注意事项:

在现有代理-代理架构之上实现监督模式提供了代理模式和编排复杂状态管理的优点。状态管理可以通过Amazon DynamoDB进行处理,并保持EventBridge用于事件路由,AWS AppConfig用于代理配置。Amazon Bedrock Converse API继续在代理商选择中发挥着至关重要的作用,但现在增加了来自主管国家管理层的背景。这允许您保留我们使用代理模式建立的动态路由功能,同时添加复杂、多步骤流程所需的复杂工作流管理。

结论

由Amazon Bedrock和AWS服务支持的代理人工智能架构代表了自动化人工智能系统发展的一次飞跃。通过将事件驱动系统的灵活性与生成式人工智能的能力相结合,这种架构使企业能够创建更具适应性、可扩展性和智能的自动化流程。代理-代理模式为将复杂任务动态路由到专门的AI代理提供了一个强大的解决方案,代理-监督模式扩展了这些功能,以处理复杂的、上下文感知的工作流。

这些模式利用了Amazon Bedrock的Converse API、Lambda、EventBridge和AWS AppConfig的优势,创建了一个灵活且可扩展的系统。代理模式擅长动态路由和无缝代理集成,而监督模式为复杂的多步骤流程添加了关键的状态管理和上下文感知。它们共同为构建复杂的人工智能系统提供了一个全面的框架,该系统可以处理简单的路由和复杂的、有状态的交互。

这种架构不仅简化了运营,还为各个行业的创新和效率开辟了新的可能性。无论是实施简单的任务路由还是编排需要维护上下文的复杂工作流程,组织都可以构建可扩展、可维护的人工智能系统,这些系统在保持运营稳定性的同时随着需求而发展。

要开始使用代理AI架构,请考虑以下步骤:

  • Explore Amazon Bedrock – If you haven’t already, sign up for Amazon Bedrock and experiment with its powerful generative AI models and APIs. Familiarize yourself with the Converse API and its tool use capabilities.
  • Prototype your own agent broker – Use the architecture outlined in this post as a starting point to build a proof-of-concept agent broker system tailored to your organization’s needs. Start small with a few specialized agents and gradually expand.
  • Identify use cases – Analyze your current business processes to identify areas where an agentic AI architecture could drive significant improvements. Consider complex, multi-step tasks that could benefit from AI assistance.
  • Stay informed – Keep up with the latest developments in AI and cloud technologies. AWS regularly updates its offerings, so stay tuned for new features that could enhance your agentic AI systems.
  • Collaborate and shareJoin AI and cloud computing communities to share your experiences and learn from others. Consider contributing to open-source projects or writing about your implementation to help advance the field.
  • Invest in training – Make sure your team has the necessary skills to work with these advanced AI technologies. Consider AWS training and certification programs to build expertise in your organization.

By embracing an agentic AI architecture, you’re not just optimizing your current processes – you’re positioning your organization at the forefront of the AI revolution. Start your journey today and unlock the full potential of AI-driven automation for your business.

本文地址
最后修改
星期二, 九月 23, 2025 - 22:58
Tags
 
Article