跳转到主要内容

热门内容

今日:


总体:


最近浏览:


Chinese, Simplified

category

环境是世界上围绕着代理人的一切,但它不是代理人本身的一部分。环境可以被描述为存在代理的情况。
环境是代理人生活、运作的地方,并为代理人提供一些感知和行动的东西。环境通常被认为是非女性主义的。


环境特征


根据Russell和Norvig的观点,从代理人的角度来看,环境可以具有各种特征:

  • 完全可观测与部分可观测
  • 静态与动态
  • 离散与连续
  • 确定性与随机性
  • 单代理与多代理
  • 情节与顺序
  • 已知与未知
  • 可访问与不可访问


1.完全可观测与部分可观测:

  • 如果代理传感器能够在每个时间点感测或访问环境的完整状态,那么它是一个完全可观察的环境,否则它是部分可观察的。
  • 一个完全可观察的环境很容易,因为不需要保持内部状态来跟踪世界的历史。
  • 在所有环境中都没有传感器的代理,那么这种环境被称为不可观测。


2.确定性与随机性:

  • 如果一个代理的当前状态和所选择的动作能够完全决定环境的下一个状态,那么这种环境被称为确定性环境。
  • 随机环境本质上是随机的,不能完全由代理决定。
  • 在确定性的、完全可观测的环境中,agent不需要担心不确定性。


3.情节与顺序:

  • 在情景环境中,有一系列一次性动作,并且该动作只需要当前感知。
  • 然而,在Sequential环境中,代理需要过去操作的内存来确定下一个最佳操作。


4.单代理与多代理

  • 如果一个环境中只涉及一个代理,并且它自己操作,那么这样的环境称为单代理环境
  • 然而,如果多个代理在一个环境中运行,那么这样的环境被称为多代理环境。
  • 多智能体环境中的智能体设计问题不同于单智能体环境。


5.静态与动态:

  • 如果环境可以在代理进行审议时自行更改,则这种环境称为动态环境,否则称为静态环境。
  • 静态环境很容易处理,因为代理在决定动作时不需要继续观察世界。
  • 然而,对于动态环境,代理需要在每次动作时不断观察世界。
  • 出租车驾驶是动态环境的一个例子,而填字游戏是静态环境的一种例子。


6.离散与连续:

  • 如果在一个环境中,可以在其中执行有限数量的感知和动作,那么这种环境被称为离散环境,否则被称为连续环境。
  • 国际象棋游戏是在离散环境下进行的,因为可以执行的棋数有限。
  • 自动驾驶汽车就是连续环境的一个例子。

7.已知与未知

  • 已知和未知实际上并不是环境的一个特征,但它是一个主体执行一个动作的知识状态。
  • 在已知的环境中,所有操作的结果对代理来说都是已知的。当处于未知环境中时,代理需要了解它是如何工作的才能执行操作。
  • 一个已知的环境很可能是部分可观测的,而一个未知的环境很有可能是完全可观测的。


8.可访问与不可访问

  • 如果一个代理可以获得关于该州环境的完整和准确的信息,那么这样的环境被称为可访问环境,否则被称为不可访问环境。
  • 一个空房间的状态可以通过其温度来定义,这就是一个可访问环境的例子。
  • 关于地球上某个事件的信息就是无法访问环境的一个例子。
本文地址
最后修改
星期日, 三月 24, 2024 - 21:06
Article