數據挖掘貝葉斯分類
貝葉斯分類是根據 貝葉斯定理。貝葉斯分類器的統計分類。貝葉斯分類器是能夠預測類別成員概率,例如一個給定的元組屬於一個特定類的概率。
貝葉斯定理
托馬斯·貝葉斯後貝葉斯定理命名。有兩種類型的概率,如下所示:
後驗概率 [P(H/X)]
先驗概率 [P(H)]
其中,X是數據元組和H是一些假設。
根據貝葉斯定理
P(H/X)= P(X/H)P(H) / P(X)
貝葉斯信仰網絡
貝葉斯信念網絡指定聯合條件概率分佈
貝葉斯網絡和概率網絡被稱爲信念網絡。
貝葉斯信念網絡允許類條件獨立的變量子集之間進行定義。
貝葉斯信念網絡提供上學習可以進行因果關係的圖形模型。
我們可以利用受過訓練的貝葉斯網絡進行分類。以下是與該貝葉斯信仰也是已知的名稱:
信念網絡
貝葉斯網絡
概率網絡
有兩個組成部分來定義貝葉斯信仰網絡:
向無環圖
一組條件概率表
向無環圖
在有向無環圖中的每個節點代表一個隨機變量。
這些變量可以是離散的或連續的重視。
這些變量可以對應於數據給出實際的屬性。
向無環圖表示
下圖顯示了一個有向無環圖六布爾變量。
圖中的電弧使因果知識的表示。例如肺癌是肺癌的一個人的家族病史,以及影響的人是否是吸菸者。值得注意的是,該可變正X光不依賴於患者是否患有肺癌的家族史或者是吸菸者,因爲我們知道患者有肺癌。
設置條件概率表表示:
條件概率表變量LungCancer(LC),顯示它的父節點,家族史(FH)和吸菸者(S)的值的每一種可能的組合的值。