Chinese, Simplified
SEO Title
category
根据智能体的感知程度和能力,可以将其分为五类。随着时间的推移,所有这些代理都可以提高性能并产生更好的操作。如下所示:
- 简单反射代理
- 基于模型的反射代理
- 基于目标的代理
- 基于效用的代理
- 学习代理
1.简单反射代理:
- 简单反射因子是最简单的因子。这些代理基于当前感知做出决策,而忽略感知历史的其余部分。
- 这些代理只有在完全可观察的环境中才能成功。
- 简单反射主体在决策和行动过程中不考虑感知历史的任何部分。
- 简单反射代理根据条件操作规则工作,这意味着它将当前状态映射到操作。例如房间清洁剂,它只有在房间里有污垢的情况下才有效。
- 简单反射剂设计方法的问题:
- 他们的智力非常有限
- 他们不了解当前状态的非感知部分
- 大多太大,无法生成和存储。
- 不适应环境的变化。
2.基于模型的代理
- 基于模型的代理可以在部分可观察的环境中工作,并跟踪情况。
- 基于模型的代理有两个重要因素:
- 模型:它是关于“世界上事情是如何发生的”的知识,所以它被称为基于模型的代理。
- 内部状态:它是基于感知历史的当前状态的表示。
- 这些代理有一个模型,“这就是世界知识”,并基于这个模型执行操作。
- 更新代理状态需要以下信息:
- 世界如何演变
- 代理人的行为如何影响世界。
3.基于目标的代理人
- 当前状态环境的知识并不总是足以决定代理要做什么。
- 代理人需要知道其目标,该目标描述了理想的情况。
- 基于目标的代理通过拥有“目标”信息来扩展基于模型的代理的功能。
- 他们选择一个行动,这样他们才能实现目标。
- 在决定目标是否实现之前,这些代理人可能必须考虑一系列可能的行动。这种对不同场景的考虑被称为搜索和规划,这使代理具有主动性。
4.基于效用的代理
- 这些代理类似于基于目标的代理,但提供了效用测量的额外组件,通过提供在给定状态下的成功度量,使它们有所不同。
- 基于效用的代理行为不仅基于目标,而且是实现目标的最佳方式。
- 当存在多种可能的替代方案,并且代理必须进行选择才能执行最佳操作时,基于实用程序的代理非常有用。
- 效用函数将每个状态映射到一个实数,以检查每个动作实现目标的效率。
5.学习代理
- 人工智能中的学习代理是指可以从过去的经验中学习,或者具有学习能力的代理。
- 它从基本知识开始行动,然后能够通过学习自动行动和适应。
- 学习主体主要有四个概念组成部分,它们是:
- 学习元素:它负责通过从环境中学习来进行改进
- 评论家:学习元素从评论家那里获得反馈,描述代理人在固定的绩效标准方面做得有多好。
- 性能元素:负责选择外部动作
- 问题生成器:该组件负责建议将带来新的信息体验的行动。
因此,学习代理能够学习、分析性能,并寻找提高性能的新方法。
- 登录 发表评论
- 6 次浏览
发布日期
星期日, 三月 24, 2024 - 21:00
最后修改
星期日, 三月 24, 2024 - 21:00
Article
最新内容
- 3 days 4 hours ago
- 3 days 4 hours ago
- 3 days 4 hours ago
- 3 days 4 hours ago
- 4 days 9 hours ago
- 1 week 5 days ago
- 1 week 5 days ago
- 1 week 5 days ago
- 2 weeks 1 day ago
- 2 weeks 1 day ago