category
在2025年纽约市AWS峰会上,亚马逊网络服务(AWS)宣布预览Amazon Bedrock AgentCore浏览器工具,这是一个完全托管的、预构建的基于云的浏览器。该工具使生成式AI代理能够与网站无缝交互。它解决了两个基本限制:首先,基础模型(FM)是在大型但静态的数据集上训练的,当API访问不容易时,需要动态访问当前信息;其次,当组织试图利用人工智能为企业用例扩展web自动化时,面临着重大挑战。
智能人工智能系统的发展正朝着可以执行复杂、多步骤任务的应用程序发展。为了使这些代理有效,它们需要访问动态实时数据,特别是来自不提供API或API集成复杂的网站和web应用程序的数据。此外,随着企业寻求在其运营中部署人工智能驱动的自动化,他们需要能够可靠扩展的解决方案,而无需管理浏览器场或解决复杂的并发问题。AgentCore Browser Tool提供了这些功能,允许代理执行自动化研究、简化操作和与基于web的应用程序交互等任务,所有这些都具有AWS云基础设施的可扩展性、可靠性和安全性。通过提供完全托管的基于云的浏览器,AWS满足了企业在数千个并发会话中大规模部署人工智能自动化的迫切需求,支持从客户服务自动化到大规模数据收集和分析的用例,而不受自我管理的浏览器自动化框架的传统复杂性和资源限制。
在这篇文章中,我们将介绍新发布的Amazon Bedrock AgentCore浏览器工具。我们探讨了为什么组织需要基于云的浏览器自动化,以及它为需要实时数据访问的功能模块解决的局限性。我们讨论了AgentCore浏览器工具的关键用例和核心功能。我们将介绍如何开始使用该工具。
为什么需要基于云的AgentCore浏览器工具?
传统的浏览器自动化方法通常需要大量的基础设施管理、安全考虑和开发专业知识。引入完全托管的基于云的浏览器自动化解决方案可以满足几个关键需求,包括简化的基础设施管理、企业级安全性、全球可用性和扩展性以及成本优化。组织不再需要提供、维护和扩展浏览器实例来支持其自动化需求。AWS现在可以处理复杂的基础设施需求,因此开发人员可以专注于构建智能代理功能,而不是管理浏览器场。基于云的浏览器自动化提供了具有AWS安全控制的隔离执行环境,降低了在控制较少的环境中可能发生的数据泄露或未经授权访问的风险。使用基于云的浏览器,您可以在AWS的全球基础设施中即时部署浏览器实例,以便浏览器自动化可以扩展。通过将浏览器自动化作为托管服务提供,组织可以使用基于消费的定价模型,而不是维护始终在线的基础设施,这可以大大降低间歇性工作负载的成本。
基于云的浏览器自动化用例
处理重复的web任务:随着Amazon Bedrock AgentCore Browser Tool的推出,组织现在可以大规模实现复杂的浏览器自动化。基于云的浏览器自动化擅长最大限度地减少跨web界面的重复任务的手动执行。AI代理可以在多个系统中填充复杂的web表单,验证条目,并保持对业务规则的遵守。代理可以导航到内部仪表板,提取关键指标,并在没有人为干预的情况下编译报告。对于管理大型用户生成内容域的组织,代理可以通过在多个web界面上预筛选内容来协助人类审核人员。
人工智能驱动的研究和情报收集:通过基于云的浏览器自动化,人工智能代理成为强大的研究助手。它们通过定期监控自动跟踪相关网站的定价变化、新产品发布或内容更新。您可以使用人工智能代理收集和分析各种网络论坛、评论网站和社交领域的消费者情绪,为产品开发提供信息。使用AgentCore浏览器工具,您可以创建自动系统,定期扫描受信任的信息源,以保持内部知识库的最新状态。
跨系统的复杂工作流自动化:许多组织跨许多缺乏集成工作流的web应用程序运行。当API不可用时,使用AgentCore浏览器工具在多个软件即服务(SaaS)系统中自动化客户设置。这有助于保持一致性并降低错误率。您可以监控供应商门户、库存系统和物流服务,以保持复杂供应链的可见性。通过在众多内部web应用程序中自动化帐户创建和权限设置,员工入职流程得以简化。
测试和质量保证:基于云的浏览器自动化实现了大规模的稳健测试。您可以使用AgentCore浏览器工具并行验证不同场景、设备和浏览器的用户体验和功能。部署代理以持续与关键业务应用程序交互,并在客户遇到性能问题之前向您的团队发出警报。使用AgentCore浏览器工具,您可以定期测试web应用程序的可访问性合规性、安全漏洞或监管要求。
遗留系统集成:许多组织维护缺乏现代API的遗留系统。使现代人工智能功能能够与替换或现代化成本高昂的传统web应用程序进行交互。将智能自动化应用于从未为程序化访问而设计的系统。因此,您可以通过定期的自动收集来提取旧web应用程序中捕获的有价值的组织数据。
核心能力
Amazon Bedrock AgentCore Browser Tool通过一个完全托管的远程浏览器基础设施,使人工智能代理能够以与人类相同的方式与网络内容进行交互,该基础设施在提供企业级安全性和可扩展性的同时,最大限度地降低了传统的复杂性。
Web交互功能
跨网站和多页工作流的完整导航控制
与JavaScript密集型应用程序和动态内容的交互
表单操作,包括文本字段、下拉菜单和文件上传
类人交互模式,如滚动、悬停和单击
无服务器浏览器基础架构
零管理浏览器舰队,自动修补
根据需求从单次会话无缝扩展到数千次会话
基于使用定价的全球部署选项
优化性能,无需基础设施开销
视觉理解
全页截图使AI能够理解布局和内容
通过外观和位置识别视觉元素
从图形元素中提取内容
分辨率和设备仿真功能
人在循环集成
为人类操作员提供实时交互式查看和控制
用于审查、培训和合规的会议记录
企业级安全
为每个浏览器实例完成会话隔离
用于访问管理的AWS身份和访问管理(IAM)控制
每次使用后重置的短暂浏览器会话
复杂的web应用程序支持
与现代JavaScript框架完全兼容
身份验证处理和会话持久性
处理异步内容和实时更新
与复杂UI模式的智能交互
审计与合规
详细的交互日志和会话记录
与AWS CloudTrail集成,实现全面跟踪
可观测性
延迟和资源使用的性能指标
与Amazon CloudWatch集成,实现统一监控
会话记录和回放可观察性
这套全面的功能弥补了人工智能代理与人类网络之间的根本差距,使组织能够构建智能代理,这些智能代理能够理解为人类设计的内容并与之交互,而不仅仅局限于基于API的集成。
AI代理如何使用AgentCore浏览器工具
Amazon Bedrock AgentCore浏览器在AgentCore中的安全、隔离的容器化环境中运行,将web活动与本地系统隔离开来。您可以使用浏览器驱动库(如Playwright)与AgentCore浏览器工具进行交互,也可以使用专门用于浏览器自动化的AI代理框架,如Amazon Nova Act和Browser use。您还可以将浏览器自动化作为一种工具集成到多代理工作流中。
Amazon Nova Act或Browser Use与AgentCore Browser Tool配合使用,从用户那里获取自然语言指令,并按照以下工作流程将其转换为浏览器上的启动:
- 用户发送一个查询,例如“在亚马逊上搜索鞋子”
- Amazon Nova Act或Browser Use等代理框架将查询传递给大型语言模型(LLM)
- LLM以结构化输出格式(例如JSON编码)推理并生成指令
- 代理框架将这些指令映射到浏览器驱动命令中(如Playwright、Puppeter或Selenium)
- 浏览器启动命令通过安全的WebSocket连接在AgentCore浏览器上执行
- 浏览器的响应和屏幕截图被发送给代理,以进一步推理
重复此过程,直到原始任务完成。流程如下图所示。
Get started
The Amazon Bedrock AgentCore Browser Tool is available for use today. For a collection of open source examples, visit the amazon-bedrock-agentcore-samples repository on GitHub.
Prerequisites
To use the Amazon Bedrock AgentCore Brower Tool, you need to complete the following prerequisites:
- Python 3.10+
- Verify your IAM user or role has the permissions to use AgentCore Browser:
For browser visualization on your local machine, you need the BrowserViewerServer
component in the repository you cloned at: 01-tutorials/05-AgentCore-tools/02-Agent-Core-browser-tool/interactive_tools
You can also visualize the browser live on the Amazon Bedrock AgentCore console at https://us-east-1.console.aws.amazon.com/bedrock-agentcore/builtInTools
The following Python code demonstrates how to use the AgentCore Browser Tool directly with the Playwright library and the Amazon Bedrock AgentCore SDK. This example initiates a secure browser session, connects to it, and automates a straightforward workflow in which it navigates to https://www.amazon.com and searches for a product.
- To get started with playwright:
- Install dependencies:
- Author your playwright-based script:
Alternatively, you can build a browser agent using Amazon Nova Act to automate web interactions:
- Sign up for Nova Act at https://nova.amazon.com/act and generate an API key.
- In the same Python virtual environment:
- Author your Nova Act based script:
Alternatively, you can run the tutorial notebooks in the Amazon Bedrock AgentCore GitHub repository.
Pricing and availability
Amazon Bedrock AgentCore offers flexible, consumption-based pricing with no upfront commitments or minimum fees. AgentCore Browser can be used independently of the other services. You can try AgentCore services at no additional charge until September 16, 2025. After this date, AgentCore Browser Tool will be charged based on consumption. Billing is calculated per second, using the highest watermark of CPU and memory usage for that second, with a 1-second minimum. 128 MB minimum memory billing applies. Network data transfer through customer elastic network interfaces is billed at standard Amazon Elastic Compute Cloud (Amazon EC2) rates
For more information about pricing, visit Amazon Bedrock AgentCore (Preview) Pricing.
结论
亚马逊基岩代理核心浏览器工具标志着人工智能网络自动化的革命性进步,为组织提供了一个完全托管的、基于云的浏览器解决方案。AgentCore Browser Tool解决了需要实时数据访问的生成式AI系统面临的关键限制,使AI代理能够通过完全导航控制、视觉理解以及与Playwright和Amazon Nova Act等框架的无缝集成等功能与网站自然交互。通过使用此工具,企业现在可以在各种用例中大规模实施复杂的自动化——从简化重复的web任务和进行人工智能增强的研究到自动化复杂的工作流程和与遗留系统集成——同时受益于AWS的可靠云基础设施,该基础设施能够适应组织需求,而无需管理浏览器场的运营开销。
Resources
To learn more and start building, visit the following resources:
- 登录 发表评论
- 1次浏览
最新内容
- 2 hours 51 minutes ago
- 2 hours 54 minutes ago
- 3 hours ago
- 3 hours ago
- 3 hours ago
- 3 hours ago
- 3 hours 23 minutes ago
- 3 hours 55 minutes ago
- 4 hours ago
- 4 hours 8 minutes ago