判別分析
判別分析的特點是根據(jù)已掌握的求豫、歷史上每個類別的若干樣本的數(shù)據(jù)信息乘粒,總結(jié)出客觀事物分類的規(guī)律性膜赃,建立判別公式和判別準則挺邀。
判別分析和聚類分析都是要求對樣本進行分類,但兩者的分析內(nèi)容和要求是不一樣的跳座。聚類分析是給定數(shù)量的樣品端铛,但樣品應(yīng)劃分出怎樣的類別還不清楚,需要聚類分析來判別疲眷。判別分析是已知樣品應(yīng)分為怎樣的類別禾蚕,判斷每一個樣品應(yīng)屬于怎樣的類別。
距離判別
距離判別是以給定樣品與各總體之間的距離的計算值為準則進行類別判斷的一種方法狂丝。由于馬氏距離不受量綱的影響换淆,因此,在距離判別法中几颜,也采用馬氏距離作為類別判斷的依據(jù)倍试。
兩個總體的判別規(guī)則
(1)若ω(x)>0 則x屬于G?
(2)若ω(x)<0 則x屬于G?
(3)若ω(x)=0 則待判
其中,ω(x)為x的線性函數(shù):(推導(dǎo)過程略)
故常稱ω(x)為線性判別函數(shù)
多總體的判別規(guī)則
協(xié)方差陣相同時:
判別函數(shù)為:
相應(yīng)的判別規(guī)則為:
協(xié)方差陣不同時:
判別函數(shù)為:
相應(yīng)的判別規(guī)則為:
Fisher判別法
該法是按照類內(nèi)方差盡量小蛋哭,類間方差盡量大的準則來要求判別函數(shù)县习。組與組的分開借用了方差分析的思想。
1. 兩總體Fisher判別
從兩個總體中抽取p個指標的樣品觀測數(shù)據(jù)具壮,根據(jù)方差分析的思想構(gòu)造一個判別函數(shù):
其中系數(shù)確定的原則是使兩組間的區(qū)別最大准颓,而使每個組內(nèi)部的離差最小。
有了判別式以后棺妓,對于一個新的樣品,將它的p個指標帶入判別函數(shù)中求出y值炮赦。然后與判別臨界值進行比較怜跑,就可以判斷它屬于哪一個總體。
分析過程:
- 建立判別函數(shù)
- 計算臨界值,然后根據(jù)判別準則對新樣品進行判別分類性芬。
- 檢驗判別效果(當兩個總體協(xié)方差陣相同且總體服從正態(tài)分布)——F檢驗
2. 多總體Fisher判別
設(shè)有k個總體G?峡眶,G?,…植锉,Gk辫樱,從中抽取的樣品數(shù)為n?,n?俊庇,…狮暑,nk,令n=n?+n?+…+nk辉饱。設(shè)判別函數(shù)為:
其中搬男,
在多總體情況下繼續(xù)選取系數(shù)向量c即可。
注:一般來說彭沼,對經(jīng)驗樣品回判率大于80%就可以使用Fisher判別缔逛。
Bayes判別法
貝葉斯判別的基本思想是認為所有G個類別都是空間中互斥的子域,每個觀測都是空間中的一個點姓惑。
在考慮先驗概率的前提下褐奴,利用Bayes公式按照一定的準則構(gòu)建一個判別函數(shù),分別計算該樣品落入各個子域的概率于毙,所有概率中最大的一類就被認為是樣品所屬的類別敦冬。
Bayes判別的數(shù)學(xué)推導(dǎo)略,其數(shù)學(xué)模型的建立可參考:[百度文庫](https://wenku.baidu.com/view/37949474a8114431b80dd803.html)望众,P5-P14
但在Bayes判斷規(guī)則之前匪补,設(shè)
有必要進行統(tǒng)計檢驗H??:μ?=μ?=…=μk。當H??被接受烂翰,說明k個總體是一樣的夯缺,也就沒有必要建立判別函數(shù);
若H??被拒絕甘耿,就需要檢驗每兩個總體之間差異的顯著性踊兜,重復(fù)操作。
逐步判別法
逐步判別的思想類似于逐步回歸佳恬。變量按照其重要性逐步引入捏境,已經(jīng)引入的變量也可能因為新的變量而被剔除。每次引入或剔除變量都進行相應(yīng)的統(tǒng)計檢驗毁葱。
利用威爾克斯統(tǒng)計量對變量的重要性進行區(qū)分:
其中Λ(X垫言,Xj)表示X與Xj的威爾克斯檢驗統(tǒng)計量,Λ=組內(nèi)離差平方和/樣本點總離差平方和倾剿。
SPSS應(yīng)用
步驟:分析->分類->判別筷频,選入變量蚌成,如下圖:
定義分組變量范圍,如下圖:
點擊Statistics
按鈕凛捏,選擇如下圖:
Fisher's:
實際是對新樣品進行判別分類的貝葉斯判別系數(shù)担忧。因為按判別函數(shù)值最大的一組進行歸類這種思想是Fisher提出的,所以SPSS用Fisher對貝葉斯方法進行命名坯癣。
未標準化:
即一般意義上的費舍爾判別函數(shù)系數(shù)(系統(tǒng)一般給出的是標準化的費舍爾判別函數(shù)系數(shù))
單擊分類
按鈕瓶盛,如下圖:
單擊Save
按鈕,選項如下圖:
主要輸出結(jié)果:
右圖是貝葉斯判別函數(shù)系數(shù)表惩猫,將樣品的各參數(shù)帶入2個貝葉斯判別函數(shù),比較得出的函數(shù)值鹉勒,哪個函數(shù)值較大就將該樣品歸于哪一類帆锋。
以及最后的樣品判別結(jié)果見下表:
可以直接讀出預(yù)測組的分類為第2類。