z-score 標(biāo)準(zhǔn)化(zero-mean normalization)
最常見(jiàn)的標(biāo)準(zhǔn)化方法就是Z標(biāo)準(zhǔn)化,也是SPSS中最為常用的標(biāo)準(zhǔn)化方法,spss默認(rèn)的標(biāo)準(zhǔn)化方法就是z-score標(biāo)準(zhǔn)化。
也叫標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化,這種方法給予原始數(shù)據(jù)的均值(mean)和標(biāo)準(zhǔn)差(standard deviation)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化。
經(jīng)過(guò)處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布燕雁,即均值為0,標(biāo)準(zhǔn)差為1鲸拥,注意拐格,一般來(lái)說(shuō)z-score不是歸一化,而是標(biāo)準(zhǔn)化刑赶,歸一化只是標(biāo)準(zhǔn)化的一種[lz]捏浊。
其轉(zhuǎn)化函數(shù)為:
x* = (x - μ ) / σ
其中μ為所有樣本數(shù)據(jù)的均值,σ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差撞叨。
z-score標(biāo)準(zhǔn)化方法適用于屬性A的最大值和最小值未知的情況金踪,或有超出取值范圍的離群數(shù)據(jù)的情況。該種標(biāo)準(zhǔn)化方式要求原始數(shù)據(jù)的分布可以近似為高斯分布牵敷,否則效果會(huì)變得很糟糕胡岔。
————————————————
版權(quán)聲明:本文為CSDN博主「-柚子皮-」的原創(chuàng)文章,遵循 CC 4.0 BY-SA 版權(quán)協(xié)議枷餐,轉(zhuǎn)載請(qǐng)附上原文出處鏈接及本聲明靶瘸。
原文鏈接:https://blog.csdn.net/pipisorry/article/details/52247379