Paste_Image.png
如果是连续值的时候,需要分离,如温度是否大于70
是否购买电脑的决策树模型
Paste_Image.png
信息熵
Paste_Image.png
计算信息熵
Paste_Image.png
变量的不确定性越大,熵越大
1.ID3
构造决策树节点问题,如何构造根节点
信息量获取: Gain(A) = Info(D) - Info_A(D)
Paste_Image.png
本身数据的信息熵
Paste_Image.png
按照年龄分后的信息熵
Paste_Image.png
Paste_Image.png
Paste_Image.png
Paste_Image.png
已age为根节点后,继续以上边的步骤构造决策树
Paste_Image.png
Paste_Image.png
算法不同选择属性的度量方法
Paste_Image.png
避免树太深
Paste_Image.png
优缺点
Paste_Image.png