程式碼如下:
import math
L = ['S','S','I','M','I','M','M','I','M','S']
F = ['S','I','M','M','M','I','S','M','S','S']
H = ['N','Y','Y','Y','Y','N','N','N','Y','Y']
R = ['N','Y','Y','Y','Y','Y','N','Y','Y','N']
def H_R(data): #求R熵的函數
Y,N = 0,0
for i in data:
if i == 'Y':
Y += 1 #統計R中為Y的個數
else:
N += 1 #統計R中為N的個數
RY = Y/(Y+N)
RN = N/(Y+N)
HR = -RY*math.log(RY,2)-RN*math.log(RN,2) #求R的熵
return HR
def H_RX(data1,data2): #求H(R|L)和H(R|F)函數
S,M,I = 0,0,0
for i in data1:
if i == 'S':
S += 1 #統計S的個數
elif i == 'M':
M += 1 #統計M的個數
else:
I += 1 #統計I的個數
RS = S/(S+M+I)
RM = M/(S+M+I)
RI = I/(S+M+I) #分別求S,M,I的概率
Rate = [RS,RM,RI]
TY,TN,HR_X = 0,0,0
count = -1 #這是一個計數器
for i in ['S','M','I']:
wd = [k for k,x in enumerate(data1) if x==i] #分別定位所有S,M,I在列表中的位置
count += 1 #作為計數器標記Rate列表對應元素
for j in wd:
if data2[j] == 'Y':
TY += 1 #統計分別在S,M,I對應的Y的數量
elif data2[j] == 'N':
TN += 1 #統計分別在S,M,I對應的N的數量
RY_X = TY/(TY+TN)
RN_X = TN/(TY+TN) #分別求在S,M,I下Y,N的概率
TY,TN = 0,0 #讓上次統計的數量清0,使得下一次統計重新開始,防止與上次疊加
if RY_X==0 or RN_X ==0: #防止出現0log0而無法計算
HR_X += 0
else:
HR_X += -Rate[count]*(RY_X*math.log(RY_X,2)+RN_X*math.log(RN_X,2))
return HR_X
def H_RH(data1,data2):
Y,N = 0,0
for i in data1:
if i == 'Y':
Y += 1
else:
N += 1 #分別統計H中Y和N的數量
RY = Y/(Y+N)
RN = N/(Y+N)#分別求出H中Y、N的概率
Rate = [RY,RN]
TY,TN,HR_H = 0,0,0
count = -1
for i in ['Y','N']:
wd = [k for k,x in enumerate(data1) if x==i] #分別定位H中所有Y和N在列表中的位置
count += 1
for j in wd:
if data2[j] == 'Y':
TY += 1 #統計分別在H中的Y、N對應的Y的數量
elif data2[j] == 'N':
TN += 1 #統計分別在H中的Y、N對應的N的數量
RY_H = TY/(TY+TN)
RN_H = TN/(TY+TN) #分別求在H的Y、N下Y,N的概率
TY,TN = 0,0 #讓上次統計的數量清0,使得下一次統計重新開始,防止與上次疊加
if RY_H==0 or RN_H ==0: #防止出現0log0而無法計算
HR_H += 0
else:
HR_H += -Rate[count]*(RY_H*math.log(RY_H,2)+RN_H*math.log(RN_H,2))
return HR_H
def G_HX(HR,HR_X):
GH_X = HR-HR_X
return GH_X
r = H_R(R)
l = H_RX(L,R)
f = H_RX(F,R)
h = H_RH(H,R)
print("資訊熵分別為\n HR={:.2f}\n H(R|L)={:.2f}\n H(R|F)={:.2f}\n H(R|H)={:.2f}".format(H_R(R),H_RX(L,R),H_RX(F,R),H_RH(H,R)))
print("資訊增益分別為\n g(L)={:.2f}\n g(F)={:.2f}\n g(H)={:.2f}".format(G_HX(r,l),G_HX(r,f),G_HX(r,h)))
執行結果如下: