基尼不純度的大概意思是 一個隨機事件變成它的對立事件的概率
例如 一個隨機事件X 设拟,
P(X=0) = 0.5 ,P(X=1)=0.5
那么基尼不純度就為
P(X=0)*(1 - P(X=0)) + P(X=1)*(1 - P(X=1)) = 0.5
一個隨機事件Y ,
P(Y=0) = 0.1 ,P(Y=1)=0.9
那么基尼不純度就為
P(Y=0)*(1 - P(Y=0)) + P(Y=1)*(1 - P(Y=1)) = 0.18
很明顯 X比Y更混亂鸽扁,因為兩個都為0.5 很難判斷哪個發(fā)生蒜绽。而Y就確定得多,Y=0發(fā)生的概率很大桶现。而基尼不純度也就越小躲雅。
所以基尼不純度也可以作為 衡量系統(tǒng)混亂程度的 標準