資料挖掘貝葉斯分類


貝葉斯分類是根據 貝葉斯定理。貝葉斯分類器的統計分類。貝葉斯分類器是能夠預測類別成員概率,例如一個給定的元組屬於一個特定類的概率。

貝葉斯定理

托馬斯·貝葉斯後貝葉斯定理命名。有兩種型別的概率,如下所示:

  • 後驗概率 [P(H/X)]

  • 先驗概率 [P(H)]

其中,X是資料元組和H是一些假設。

根據貝葉斯定理

 

P(H/X)= P(X/H)P(H) / P(X)

 

貝葉斯信仰網路

  • 貝葉斯信念網路指定聯合條件概率分布

  • 貝葉斯網路和概率網路被稱為信念網路。

  • 貝葉斯信念網路允許類條件獨立的變數子集之間進行定義。

  • 貝葉斯信念網路提供上學習可以進行因果關係的圖形模型。

我們可以利用受過訓練的貝葉斯網路進行分類。以下是與該貝葉斯信仰也是已知的名稱:

  • 信念網路

  • 貝葉斯網路

  • 概率網路

有兩個組成部分來定義貝葉斯信仰網路:

  • 向無環圖

  • 一組條件概率表

向無環圖

  • 在有向無環圖中的每個節點代表一個隨機變數。

  • 這些變數可以是離散的或連續的重視。

  • 這些變數可以對應於資料給出實際的屬性。

向無環圖表示

下圖顯示了一個有向無環圖六布林變數。

Acyclic Graph

圖中的電弧使因果知識的表示。例如肺癌是肺癌的一個人的家族病史,以及影響的人是否是吸菸者。值得注意的是,該可變正X光不依賴於患者是否患有肺癌的家族史或者是吸菸者,因為我們知道患者有肺癌。

設定條件概率表表示:

條件概率表變數LungCancer(LC),顯示它的父節點,家族史(FH)和吸菸者(S)的值的每一種可能的組合的值。

Probability Table