人工智慧AI代理環境


環境是圍繞代理的一切,但它不是代理本身的一部分。環境可以描述為存在代理的情況。操作為代理提供感知和行動的環境。

環境特徵

根據Russell和Norvig的說法,從代理的角度來看,環境可以具有以下幾種功能:

  • 完全可觀察與部分可觀察
  • 靜態與動態
  • 離散與連續
  • 確定性與隨機性
  • 單一代理與多代理
  • 情節與順序
  • 已知與未知
  • 無障礙與無法存取

1. 完全可觀察與部分可觀察

  • 如果代理感測器可以在每個時間點感知或存取環境的完整狀態,那麼它是完全可觀察的環境,否則它是部分可觀察的。
  • 完全可觀察的環境很容易,因為沒有必要保持內部狀態以跟蹤世界歷史。
  • 在所有環境中都沒有感測器的代理,那麼這樣的環境稱為不可觀察的。

2. 確定性與隨機性:

  • 如果代理的當前狀態和所選動作可以完全確定環境的下一個狀態,則這種環境稱為確定性環境。
  • 隨機環境本質上是隨機的,不能由代理完全確定。
  • 在確定性的,完全可觀察的環境中,代理不需要擔心不確定性。

3. 情節與順序

  • 在情節環境中,存在一系列一次性動作,並且動作僅需要當前感知。
  • 但是,在順序環境中,代理需要記憶過去的操作以確定下一個最佳操作。

4. 單一代理與多代理

  • 如果環境中只涉及一個代理,並且單獨執行,那麼這樣的環境稱為單個代理環境。
  • 但是,如果多個代理在環境中執行,則此類環境稱為多代理環境。
  • 多代理環境中的代理設計問題與單代理環境不同。

5. 靜態與動態

  • 如果環境可以在代理審議時自行更改,則此類環境稱為動態環境,否則稱為靜態環境。
  • 靜態環境很容易處理,因為代理在決定操作時不需要繼續檢視世界。
  • 但是對於動態環境,代理需要在每個操作中繼續關注世界。
  • 出租車駕駛是動態環境的一個例子,而填字遊戲是靜態環境的一個例子。

6. 離散與連續

  • 如果在一個環境中存在可以在其中執行的有限數量的感知和動作,那麼這樣的環境稱為離散環境,否則它稱為連續環境。
  • 國際象棋遊戲在離散環境下進行,因為可以執行有限數量的移動。
  • 自動駕駛汽車是連續環境的一個例子。

7. 已知與未知

  • 已知和未知實際上不是環境的一個特徵,但它是代理執行操作的知識狀態。
  • 在已知環境中,代理已知所有操作的結果。在未知環境中,代理需要了解其工作方式才能執行操作。
  • 很可能一個已知環境可以被部分觀察到,並且一個未知環境可以被完全觀察到。

8. 無障礙與無法存取

  • 如果代理可以獲得有關狀態環境的完整且準確的資訊,則此類環境稱為可存取環境,否則稱為無法存取。
  • 可以通過其溫度定義其狀態的空房間是可存取環境的範例。
  • 有關地球事件的資訊是無法存取環境的例子。