代理可以根據其感知智慧和能力的程度分為五類。所有這些代理都可以改善其效能並在一段時間內產生更好的行動。這些如下:
- 簡單的反射代理
- 基於模型的反射代理
- 基於目標的代理商
- 基於效用的代理
- 學習代理
1. 簡單的反射代理
- 簡單反射代理是最簡單的代理。這些代理人根據當前的感知來做出決定,並忽略其餘的感知歷史。
- 這些代理只能在完全可觀察的環境中取得成功。
- 簡單反射代理在決策和行動過程中不考慮感知歷史的任何部分。
- 簡單反射代理適用於Condition-action規則,它將當前狀態對映到操作。如房間清潔劑,只有在房間有汙垢時才有效。
- 簡單反射代理設計方法的問題:
- 它們的智力非常有限。
- 它們不了解當前狀態的非感知部分。
- 通常太大而無法生成和儲存。
- 不適應環境的變化。
2. 基於模型的反射代理
- 基於模型的代理可以在部分可觀察的環境中工作,並跟蹤情況。
- 基於模型的代理有兩個重要因素:
- 模型:它是關於「世界上的事情如何發生」的知識,因此它被稱為基於模型的代理。
- 內部狀態:它是基於感知歷史的當前狀態的表示。
- 這些代理人擁有「對世界的了解」的模型,並根據他們執行操作的模型。
- 更新代理狀態需要以下資訊:
3. 基於目標的代理
- 當前狀態環境的知識並不總是足以決定代理做什麼。
- 代理人需要知道描述理想情況的目標。
- 基於目標的代理通過獲取「目標」資訊來擴充套件基於模型的代理的功能。
- 選擇一個動作,以便它們能夠實現目標。
- 在決定是否實現目標之前,這些代理可能必須考慮一系列可能的動作。對不同場景的這種考慮稱為搜尋和計劃,這使得代理主動。
4. 基於效用的代理
- 這些代理與基於目標的代理類似,但提供了效用度量的額外組成部分,通過在給定狀態下提供成功度量,使它們不同。
- 基於效用的代理不僅基於目標而且基於實現目標的最佳方式。
- 當存在多個可能的替代方案時,基於實用程式的代理程式非常有用,並且代理程式必須選擇以執行最佳操作。
- 效用函式將每個狀態對映到實數,以檢查每個操作實現目標的效率。
5. 學習代理
- AI中的學習代理是可以從過去的經驗中學習或具有學習能力的代理型別。
- 它開始以基本知識行動,然後能夠通過學習自動行動和適應。
- 學習代理主要有四個概念元件,它們是:
- 學習要素:它通過學習環境來改進。
- 評論家:學習元素從評論家那裡獲得反饋,這些反饋描述了代理人在固定績效標準方面的表現。
- 績效要素:負責選擇外部行動。
- 問題生成器:該元件負責建議可以帶來新的資訊體驗的操作。
- 因此,學習代理能夠學習,分析效能,並尋找提高效能的新方法。