跳转到主要内容
Chinese, Simplified

category

人工智能将改变我们所有人的工作和生活方式。我们的AWS首席执行官Matt Garman分享了一个与互联网的出现一样具有变革性的技术变革愿景。我被这个愿景所激励,因为我亲眼目睹了这些智能智能体系统是如何开始解决复杂问题、自动化工作流程并在各个行业创造新的可能性的。凭借智能体人工智能,阿斯利康加速了医疗保健洞察力的发现,雅虎财经为数百万投资者改变了金融研究,先正达通过人工智能驱动的精准农业彻底改变了农业。

为了将这些早期的成功推广到广泛采用,组织需要一种实用的方法来解决智能体系统的固有复杂性。在AWS,我们致力于成为构建世界上最有用的人工智能智能体的最佳场所,使组织能够大规模部署可靠和安全的智能体。

我们致力于通过将快速创新与强大的安全性、可靠性和卓越运营基础相结合,使每个组织都能实现我们的智能体人工智能愿景。我们的方法通过建立在经过验证的原则之上,同时拥抱新的可能性来加速进展——创建可以随着模型的发展、新功能的出现和用例在整个业务中的扩展而适应的系统。

今天,我很高兴与大家分享我们如何通过解决大规模构建和部署智能体的基本方面的新功能来实现这一愿景。这些创新将帮助您超越实验,转向生产就绪的智能体系统,这些系统可以与您最关键的业务流程相信任。

为大规模构建和部署生产就绪的智能体人工智能系统奠定了全面的基础。

为智能体制定的指导原则


在AWS,我们的智能体人工智能方法是由我们在内部构建智能体系统并帮助数十万客户加速其人工智能之旅的经验所塑造的。四个核心原则指导着我们在这个领域所做的一切:

原则1:将敏捷性视为竞争优势


蓬勃发展的组织不会是那些完美预测未来的组织,而是那些在未来发展过程中迅速适应的组织。保持灵活性需要一个包含灵活性和开放性的智能体架构,而不是僵化的框架或单一的模型。这意味着构建的系统可以在新模型出现时将其合并,连接到您的专有数据源,并与您现有的工具无缝集成。

对稳定性和适应性的双重需求促使我们创建了Amazon Bedrock AgentCore,这是一套完整的服务,用于在企业规模上安全地部署和操作功能强大的智能体。AgentCore提供了一个安全的、无服务器的运行时环境,具有完全的会话隔离和目前可用的最长运行时间的工作负载,帮助智能体以正确的权限和上下文执行工作流的工具和功能,以及操作可信任智能体的控制。它的功能可以一起使用或独立使用,并与流行的开源框架(如CrewAI、LangGraph、LlamaIdex和Strands Agents)以及任何模型(包括Amazon Bedrock内外的模型)配合使用,因此开发人员可以在技术转变时保持敏捷。通过减少无差别的繁重工作,AgentCore帮助组织从实验转向生产就绪的智能体系统,这些系统可以与您最关键的业务流程相信任。

ItaúUnibanco、Innovaccer、Boomi、Box和Epsilon等客户已经在试验AgentCore,并对其如何加速将智能体部署到生产中感到兴奋。这些早期采用者认识到,AgentCore有助于消除开源灵活性与企业级安全性和可靠性之间的权衡,使他们能够专注于创造业务价值,而不是从头开始构建安全和运营基础。

原则2:为智能体时代发展基础


虽然企业技术的核心原则没有改变,但我们如何实现它们必须随着智能体时代的发展而发展。这些不断发展的基本原理为生产级试剂的实现奠定了基础:

  • 安全与信任。智能体在跨越系统边界、代表用户执行操作或在预先授权的用户同意下自行行事时引入了新的安全考虑。信任需要透明度、护栏和验证。AgentCore Runtime通过每个会话的专用计算环境和内存隔离来帮助解决这些问题,这有助于防止智能体之间的数据泄漏,建立在AWS Lambda无服务器在安全性和可扩展性方面十年的创新之上。
  • 可靠性和可扩展性。传统的软件扩展方法不适用于智能体系统,因为它们遵循不可预测的执行路径,并且在交互中具有可变的资源需求。AgentCore Runtime高度可靠,具有检查点和恢复功能,有助于在意外中断和故障的情况下确保优雅的恢复,并且可以自动处理从零到数千个并发会话的扩展,消除了容量规划和基础设施维护。
  • 身份。随着智能体代表用户和系统行事,传统的身份模型必须进化。当智能体在跨多个系统的复杂工作流中导航时,管理智能体和用户的权限对于保护您的数据至关重要。AgentCore Identity提供跨AWS服务和第三方应用程序和工具的安全智能体访问,具有临时、细粒度的权限和基于标准的身份验证。它与亚马逊Cognito、微软Entra ID和Okta等领先的身份提供商以及GitHub、谷歌、Salesforce和Slack等流行的OAuth提供商合作。
  • 可观察性。了解智能体决策需要新的监控方法。可观察性不仅对故障排除至关重要,而且对合规性和持续改进也至关重要,这代表了从定期审计到持续监督的转变。AgentCore Observability通过内置仪表板和与您的监控堆栈集成的标准化遥测技术提供实时可见性。
  • 数据。您的专有数据比以往任何时候都更有价值,使智能体能够了解您的特定环境。安全访问、处理和学习这些数据的能力成为智能体性能和相关性的关键区别因素。例如,使用AgentCore Gateway,您可以将包括亚马逊基岩知识库在内的数据源转换为与智能体兼容的工具,以便智能体可以访问最新和相关的信息。
  • 无缝集成。智能体必须与您环境中的所有内容协同工作:您的系统、其他云、SaaS应用程序和其他智能体。AgentCore Gateway通过用最少的代码将API和服务转换为与智能体兼容的工具,消除了数月的集成工作,同时使智能体能够发现并与您的系统交互,从而实现了这一目标。我们的开源Strands Agents SDK通过灵活的编排模式对此进行了补充,并支持MCP和A2A,以实现不同环境中多个智能体和工具之间的无缝协调。AWS API MCP服务器为智能体提供了一个可调用的AWS服务接口,使基础模型能够发现可用的操作、对输入和输出要求进行推理,并生成调用AWS API的计划,以探索、配置或管理具有模型培训截止时间之外的实时AWS功能的资源。
  • 工具和能力。智能体需要专门的工具来执行复杂的任务,并在交互中维护上下文。AgentCore Memory通过消除复杂的内存基础设施管理,同时提供对AI智能体记忆内容的完全控制,使开发人员能够轻松构建上下文感知智能体。它提供了业界领先的准确性,同时支持多回合对话的短期记忆和跨会话持续的长期记忆,并能够在协作智能体之间共享内存存储。内置工具包括用于web交互的AgentCore浏览器,使智能体能够代表您浏览网站并执行操作,以及用于安全执行代码的AgentCore代码解释器,允许智能体以编程方式处理数据、生成可视化和解决复杂问题。这些功能扩展了智能体在保持安全性和可靠性的同时可以做的事情。

https://youtu.be/usFIb9aEd1U

这些不断发展的基础知识共同帮助组织构建安全、可靠和可扩展的智能体架构,在生产环境中提供一致的结果。通过AgentCore,我们帮助客户专注于创造价值,而不是重塑基础设施。

原则3:通过模型选择和数据提供卓越的结果


每个有效的智能体系统的核心都是它的基础模型,它赋予智能体理解、推理和行动的能力。为了让智能体提供变革性的体验,精心挑选并可能量身定制的模型需要与丰富的、特定于上下文的知识进行交互,这些知识决定了模型代表您做出决策的有效性。这一现实扩展到所有人工智能应用程序,这就是为什么AWS为客户提供了为每个用例选择最佳模型的自由,以及用其独特数据增强这些模型的工具。这种方法为所有人工智能实现提供了卓越的结果和最佳的性价比。

模型要求差异很大——一些应用程序需要复杂的推理,另一些应用程序要求快速响应,许多应用程序优先考虑大规模的成本效益。没有一款车型在所有维度上都表现出色,这就是为什么我们在2023年率先与亚马逊Bedrock合作选择车型。但真正的区别在于你如何将模型与组织的专有数据相结合,将通用人工智能转化为具有深厚领域专业知识的系统。

为了帮助您创建具有高水平专业知识的模型,今天我们在Amazon SageMaker AI中推出了Amazon Nova定制功能,从而扩展了我们的模型定制能力。Nova模型现在为客户提供了在模型开发生命周期内定制模型的灵活性。这包括预培训和后培训,包括微调和对齐,支持参数高效微调(PEFT)和全面微调。有了这些,Nova现在为任何专有型号系列提供了最全面的型号定制功能。使用监督微调(SFT)、直接偏好优化(DPO)、使用邻近策略优化(PPO)从人类反馈中强化学习、持续预训练(CPT)和知识蒸馏等技术,客户可以创建针对其用例优化的Nova模型。一旦定制,这些模型可以直接部署到Amazon Bedrock,使您能够将自定义模型无缝集成到智能体系统和其他AI应用程序中。

我们也在训练针对特定智能体用例优化的模型。Nova Act是一个经过训练的AI模型,可以在web浏览器中执行操作。客户可以使用Nova Act SDK开始构建自己的浏览器自动化智能体,该SDK专门用于启用由Nova Act模型支持的可靠浏览器智能体。Nova Act SDK今天在研究预览版中可用,它使用AgentCore Browser进行可扩展的、基于云的浏览器执行。

一旦你有了正确的模型,你需要确保它可以与你组织的专有和当前数据交互。矢量已经成为人工智能模型访问数据的主要和最快的方式。到目前为止,存储向量嵌入的成本——实现这种智能的关键——迫使组织将其人工智能系统仅限于最新数据,从而限制了它们的潜力。今天推出的Amazon S3 Vectors是第一个支持原生矢量的云对象存储,标志着一个根本性的变化。通过将矢量存储成本降低90%,同时保持亚秒级的查询性能,S3矢量使智能体能够记住更多、推理更深入,并从每次客户交互、文档和业务洞察中维护全面的上下文。S3矢量直接与Amazon基岩知识库集成,以实现经济高效的RAG应用程序,并与Amazon OpenSearch Service集成,以提供分层矢量策略。

原则4:部署改变体验的解决方案


虽然模型和基础设施改变了组织的构建方式,但智能体解决方案改变了企业的运营方式。智能体人工智能的真正力量在于它能够重塑整个行业的工作流程和人类生产力。这些解决方案将人们从日常任务中解放出来,处理复杂的信息流,使团队能够专注于创造性思维和战略决策。我们正在通过预构建的智能体解决方案使更多的组织能够实现这一转型。通过将基础构建块与预构建的解决方案相结合,您可以超越实验,转向提供切实业务影响的全面人工智能策略。

今天,我们宣布您现在可以在AWS Marketplace中购买AI智能体和工具,简化采购和多种部署选项。在当今支离破碎的人工智能环境中,AWS Marketplace提供了一个由AWS合作伙伴策划的智能体、工具和解决方案的集中目录。通过AWS合作伙伴的预构建智能体实现快速自动化。我们新的基于API的部署方法可帮助您简化与支持MCP和A2A的其他智能体和工具的集成。这些智能体可以在受信任的AWS服务上运行,也可以在您的AWS环境中运行,您可以在其中保持对安全性和访问的控制。您可以在AgentCore上部署选定的预构建智能体和工具。

我们还将继续为客户提供可随时部署的智能体解决方案,以实现这一转型。Kiro是一个AI IDE,通过规范驱动的开发帮助开发人员从概念到生产。从简单到复杂的任务,Kiro与您一起将提示转化为详细的规范,然后转化为工作代码、文档和测试。所以,你构建的正是你想要的,并准备与你的团队分享。Kiro的智能体可以帮助您解决具有挑战性的问题,并自动化生成文档和单元测试等任务。有了Kiro,您可以在驾驶座上的每一步都超越原型进行构建。AWS Transform部署了专门的AI智能体来自动化复杂的现代化任务,如代码分析、重构和依赖关系映射,从而大大缩短了企业工作负载迁移的项目时间。每个解决方案都表明了我们对灵活性和选择的承诺,帮助您更快地创新,更快地实现业务成果。Amazon Connect是一个全面的客户体验解决方案,使组织能够在所有渠道的每一次客户互动中通过无限的人工智能来取悦客户。

这四项原则指导着我们的产品战略,并嵌入我们今天宣布的每一项创新中:拥抱敏捷性、不断发展的基础、将模型选择与专有数据相结合,以及部署变革性解决方案。它们共同为在您的组织中成功实施智能体人工智能提供了一个全面的框架。

前进的道路


我们的客户和我们自己的多元化业务的巨大潜力激励我们专注于构建地球上最值得信赖的智能体人工智能能力。但我能提供的最重要的建议很简单:现在就开始。

不要被困在试图煮沸大海或在开始之前等待所有答案的过程中。选择一个重要的具体业务问题并开始构建。看到最大成功的组织不是那些有最雄心勃勃的计划的组织,而是那些已经开始学习周期的组织,他们收集现实世界的反馈,为每次迭代提供信息。为了帮助我们的客户踏上人工智能之旅,我们将在AWS生成人工智能创新中心再投资1亿美元,使我们的投资翻一番,该中心已帮助NFL、雅虎财经、宝马和阿斯利康等行业的数千名客户实现了数百万美元的生产力提升,并改变了客户体验。

AWS为云计算的安全性、可靠性和数据隐私设定了标准,我们将这些原则引入智能体人工智能。无论您的用例或要求如何,AWS都能为您的成功提供正确的基础。我们可以共同通过智能体人工智能的力量为您的业务重塑可能性。

 

本文地址
最后修改
星期日, 九月 21, 2025 - 23:11
Article