幾種常用數(shù)據(jù)標(biāo)準(zhǔn)化方法

引入

評價是現(xiàn)代社會各領(lǐng)域的一項經(jīng)常性的工作,是科學(xué)做出管理決策的重要依據(jù)革砸。隨著人們研究領(lǐng)域的不斷擴(kuò)大蔼两,所面臨的評價對象日趨復(fù)雜酝枢,如果僅依據(jù)單一指標(biāo)對事物進(jìn)行評價往往不盡合理匈仗,必須全面地從整體的角度考慮問題瓢剿,多指標(biāo)綜合評價方法應(yīng)運而生。所謂多指標(biāo)綜合評價方法悠轩,就是把描述評價對象不同方面的多個指標(biāo)的信息綜合起來间狂,并得到一個綜合指標(biāo),由此對評價對象做一個整體上的評判火架,并進(jìn)行橫向或縱向比較前标。

而在多指標(biāo)評價體系中,由于各評價指標(biāo)的性質(zhì)不同距潘,通常具有不同的量綱和數(shù)量級。當(dāng)各指標(biāo)間的水平相差很大時只搁,如果直接用原始指標(biāo)值進(jìn)行分析音比,就會突出數(shù)值較高的指標(biāo)在綜合分析中的作用,相對削弱數(shù)值水平較低指標(biāo)的作用氢惋。因此洞翩,為了保證結(jié)果的可靠性,需要對原始指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理焰望。

目前數(shù)據(jù)標(biāo)準(zhǔn)化方法有多種骚亿,歸結(jié)起來可以分為直線型方法(如極值法、標(biāo)準(zhǔn)差法)熊赖、折線型方法(如三折線法)来屠、曲線型方法(如半正態(tài)性分布)。不同的標(biāo)準(zhǔn)化方法震鹉,對系統(tǒng)的評價結(jié)果會產(chǎn)生不同的影響俱笛,然而不幸的是,在數(shù)據(jù)標(biāo)準(zhǔn)化方法的選擇上传趾,還沒有通用的法則可以遵循迎膜。

數(shù)據(jù)的標(biāo)準(zhǔn)化(normalization)是將數(shù)據(jù)按比例縮放,使之落入一個小的特定區(qū)間浆兰。在某些比較和評價的指標(biāo)處理中經(jīng)常會用到磕仅,去除數(shù)據(jù)的單位限制珊豹,將其轉(zhuǎn)化為無量綱的純數(shù)值,便于不同單位或量級的指標(biāo)能夠進(jìn)行比較和加權(quán)榕订。其中最典型的就是數(shù)據(jù)的歸一化處理店茶,即將數(shù)據(jù)統(tǒng)一映射到[0,1]區(qū)間上,常見的數(shù)據(jù)歸一化的方法有:min-max標(biāo)準(zhǔn)化(Min-max normalization)卸亮,log函數(shù)轉(zhuǎn)換忽妒,atan函數(shù)轉(zhuǎn)換,z-score標(biāo)準(zhǔn)化(zero-mena normalization兼贸,此方法最為常用)段直,模糊量化法。本文只介紹min-max法(規(guī)范化方法)溶诞,z-score法(正規(guī)化方法)鸯檬,比例法(名字叫啥不太清楚,歸一化方法)螺垢。

1喧务、min-max標(biāo)準(zhǔn)化(Min-maxnormalization)

也叫離差標(biāo)準(zhǔn)化,是對原始數(shù)據(jù)的線性變換枉圃,使結(jié)果落到[0,1]區(qū)間功茴,轉(zhuǎn)換函數(shù)如下:


離差標(biāo)準(zhǔn)化
  • 其中max為樣本數(shù)據(jù)的最大值,min為樣本數(shù)據(jù)的最小值孽亲。
  • 這種方法有一個缺陷就是當(dāng)有新數(shù)據(jù)加入時坎穿,可能導(dǎo)致max和min的變化,需要重新定義返劲。

2玲昧、log函數(shù)轉(zhuǎn)換

通過以10為底的log函數(shù)轉(zhuǎn)換的方法同樣可以實現(xiàn)歸一下,具體方法看了下網(wǎng)上很多介紹都是x=log10(x)篮绿,其實是有問題的孵延,這個結(jié)果并非一定落到[0,1]區(qū)間上,應(yīng)該還要除以log10(max)*亲配,max為樣本數(shù)據(jù)最大值尘应,并且所有的數(shù)據(jù)都要大于等于1。

3弃榨、atan函數(shù)轉(zhuǎn)換

用反正切函數(shù)也可以實現(xiàn)數(shù)據(jù)的歸一化菩收,使用這個方法需要注意的是如果想映射的區(qū)間為[0,1],則數(shù)據(jù)都應(yīng)該大于等于0鲸睛,小于0的數(shù)據(jù)將被映射到[-1,0]區(qū)間上娜饵。

4、z-score 標(biāo)準(zhǔn)化(zero-meannormalization)

而并非所有數(shù)據(jù)標(biāo)準(zhǔn)化的結(jié)果都映射到[0,1]區(qū)間上官辈,其中最常見的標(biāo)準(zhǔn)化方法就是Z標(biāo)準(zhǔn)化箱舞;也是SPSS中最為常用的標(biāo)準(zhǔn)化方法遍坟,也叫標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化

z-score 標(biāo)準(zhǔn)化

  • 這種方法基于原始數(shù)據(jù)的均值(mean)和標(biāo)準(zhǔn)差(standard deviation)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化晴股。將A的原始值x使用z-score標(biāo)準(zhǔn)化到x’愿伴。
  • z-score標(biāo)準(zhǔn)化方法適用于屬性A的最大值和最小值未知的情況,或有超出取值范圍的離群數(shù)據(jù)的情況电湘。
  • spss默認(rèn)的標(biāo)準(zhǔn)化方法就是z-score標(biāo)準(zhǔn)化隔节。
  • 用Excel進(jìn)行z-score標(biāo)準(zhǔn)化的方法:在Excel中沒有現(xiàn)成的函數(shù),需要自己分步計算寂呛,其實標(biāo)準(zhǔn)化的公式很簡單怎诫。

步驟如下:
1.求出各變量(指標(biāo))的算術(shù)平均值(數(shù)學(xué)期望)xi和標(biāo)準(zhǔn)差si ;
2.進(jìn)行標(biāo)準(zhǔn)化處理:
zij=(xij-xi)/si
其中:zij為標(biāo)準(zhǔn)化后的變量值贷痪;xij為實際變量值幻妓。
3.將逆指標(biāo)前的正負(fù)號對調(diào)。
標(biāo)準(zhǔn)化后的變量值圍繞0上下波動劫拢,大于0說明高于平均水平肉津,小于0說明低于平均水平。

5舱沧、歸一化方法

歸一化方法

歡迎大家關(guān)注我的公眾號


半畝房頂
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末妹沙,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子熟吏,更是在濱河造成了極大的恐慌初烘,老刑警劉巖,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件分俯,死亡現(xiàn)場離奇詭異,居然都是意外死亡哆料,警方通過查閱死者的電腦和手機缸剪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來东亦,“玉大人杏节,你說我怎么就攤上這事〉湔螅” “怎么了奋渔?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長壮啊。 經(jīng)常有香客問我嫉鲸,道長,這世上最難降的妖魔是什么歹啼? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任玄渗,我火速辦了婚禮座菠,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘藤树。我一直安慰自己浴滴,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布岁钓。 她就那樣靜靜地躺著升略,像睡著了一般。 火紅的嫁衣襯著肌膚如雪屡限。 梳的紋絲不亂的頭發(fā)上品嚣,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天,我揣著相機與錄音囚霸,去河邊找鬼腰根。 笑死,一個胖子當(dāng)著我的面吹牛拓型,可吹牛的內(nèi)容都是我干的额嘿。 我是一名探鬼主播,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼劣挫,長吁一口氣:“原來是場噩夢啊……” “哼册养!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起压固,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤球拦,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后帐我,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體坎炼,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年拦键,在試婚紗的時候發(fā)現(xiàn)自己被綠了谣光。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡芬为,死狀恐怖萄金,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情媚朦,我是刑警寧澤氧敢,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布,位于F島的核電站询张,受9級特大地震影響孙乖,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一的圆、第九天 我趴在偏房一處隱蔽的房頂上張望鼓拧。 院中可真熱鬧,春花似錦越妈、人聲如沸季俩。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽酌住。三九已至,卻和暖如春阎抒,著一層夾襖步出監(jiān)牢的瞬間酪我,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工且叁, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留都哭,地道東北人。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓逞带,卻偏偏與公主長得像欺矫,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子展氓,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容