常用的主流數(shù)據統(tǒng)計分析方法:2.判別分析

1. 判別分析的基本思想

a. 目的:識別一個個體所屬類別
b. 適用:被解釋對象是非度量變量(nonmetric),解釋變量是度量變量;分組類型2組以上哪廓,每組樣品>1为肮。
c. 應用:歸類叉钥、預測
d. 判別分析與聚類分析
i. 聚類分析前,我們并不知道應該分幾類篙贸,分類工作投队;
ii. 判別分析時,樣品的分類已事先確定歉秫,需要利用訓練樣 本建立判別準則蛾洛,對新樣品所屬類別進行判定,歸類工作雁芙。

2. 判別分析的三大假設:

a. 假設1:每一個判別變量(解釋變量)不能是其他判別變量的線性組合轧膘。避免多重共線性問題。
b. 假設2:如果采用線性判別函數(shù)兔甘,還要求各組變量協(xié)方差矩陣相等----線性判別函數(shù)使用起來最方便谎碍、在實際 中使用最廣。
c. 假設3:各判別變量遵從多元正態(tài)分布洞焙,可精確的計算 顯著性檢驗值和歸屬概率蟆淀,不然計算概率不準。

  1. 核心思想:樣品和哪個總體距離最近,就判它屬哪個總體澡匪。

3. 距離判別

兩總體:

協(xié)方差相等/協(xié)方差不等

多總體:

協(xié)方差相等/協(xié)方差不等

3.2距離判別的小結:

優(yōu)點

i. 距離判別只要求知道總體的特征量(即參數(shù))---均值和協(xié)差陣,不涉及總體的分布類型.
ii. 當參數(shù)未知時,就用樣本均值和 樣本協(xié)差陣來估計.
iii. 距離判別方法簡單,結論明確,是很實用的方法.

ii. 缺點
i. 該判別法與各總體出現(xiàn)的機會大小(先驗概率)完全無關
ii. 判別方法沒有考慮錯判造成的損失,這是不合理的.

4. 貝葉斯判別

v. 貝葉斯判別的基本思想

i. 假定對研究對象已經有了一定的認識熔任,這種認識可以用先驗概率來描述,當取得樣本后唁情,就可以利用樣本來修正已有的 先驗概率分布疑苔,得到后驗概率分布,再通過后驗概率分布進 行各種統(tǒng)計推斷甸鸟。
ii. 貝葉斯判別屬于概率判別法惦费。

iii. 判別準則:
i. 個體歸屬某類的概率(后驗概率)最大
ii. 錯判總平均損失最小為標準。
vi. 貝葉斯判別的后驗概率最大

貝葉斯小結

i. 貝葉斯(Bayes)判別要變量服從正態(tài)分布類型抢韭。
ii. 薪贫、貝葉斯(Bayes)判別的判別準則是以個體歸屬某類的概率最大或錯判總平均損失最小為標準。彌補了 距離判別和費歇(Fisher)判別的缺點刻恭。

5. 費歇(Fisher)判別

5.1費歇(Fisher)判別核心思想
i. 通過多維數(shù)據投影到一維度直線上瞧省,將k組m維數(shù)據投影到 某一個方向,使得投影后組與組之間盡可能地分開。而衡量組 與組之間是否分開的方法借助于一元方差分析的思想
ii. 費歇(Fisher)判別是一種確定性判別吠各。

5.2費歇(Fisher)判別小結
i. 費歇(Fisher)判別對判別變量的分布類型并無要求臀突, 而貝葉斯(Bayes)判別要變量服從正態(tài)分布類型。因此贾漏, Fisher類判別較Bayes類判別簡單一些候学。
ii. 當兩個總體時,若它們的協(xié)方差矩陣相同纵散,則距離判 別和Fisher判別等價梳码。 當變量服從正態(tài)分布時隐圾,它們還 和Bayes判別等價。
iii. 與距離判別一樣掰茶,費歇判別與各總體出現(xiàn)的機會大小 (先驗概率)完全無關暇藏;也沒有考慮錯判造成的損失。

6. 逐步判別

6.1背景與意義
i. 目的:

如何從m個變量中挑選出對區(qū)分k個總體有顯 著判別能力的變量,來建立判別函數(shù),用以判別歸類濒蒋。

ii. 常見問題:

1.忽略主要的指標盐碱;

  1. 引入太多 的指標,計算量大又干擾分析沪伙。
iii. 定義:

凡是具有篩選變量能力的判別方法統(tǒng)稱為逐步判別法瓮顽。

6.2. 主要思想:

i. 保留判別能力顯著的變量
ii. 剔除判別能力不顯著的變量

6.3. 具體步驟:

i. 逐步篩選變量
i. 根據各變量對區(qū)分k個總體的判別能力的大小,利用向 前選入围橡、向后剔除或逐步篩選的方法來選擇區(qū)分k個總體的 最佳變量子集暖混。
ii. 判別歸類
i. 對已選出變量子集,使用三大判別方法(距離判別翁授、 Bayes判別拣播、Fisher判別)對樣品進行判別歸類。

判別分析主要有哪三種方法收擦,比較一下這三種判別方法的異同贮配?

image.png
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市塞赂,隨后出現(xiàn)的幾起案子牧嫉,更是在濱河造成了極大的恐慌,老刑警劉巖减途,帶你破解...
    沈念sama閱讀 219,589評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異曹洽,居然都是意外死亡鳍置,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,615評論 3 396
  • 文/潘曉璐 我一進店門送淆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來税产,“玉大人,你說我怎么就攤上這事偷崩”倏剑” “怎么了?”我有些...
    開封第一講書人閱讀 165,933評論 0 356
  • 文/不壞的土叔 我叫張陵阐斜,是天一觀的道長衫冻。 經常有香客問我,道長谒出,這世上最難降的妖魔是什么隅俘? 我笑而不...
    開封第一講書人閱讀 58,976評論 1 295
  • 正文 為了忘掉前任邻奠,我火速辦了婚禮,結果婚禮上为居,老公的妹妹穿的比我還像新娘碌宴。我一直安慰自己,他們只是感情好蒙畴,可當我...
    茶點故事閱讀 67,999評論 6 393
  • 文/花漫 我一把揭開白布贰镣。 她就那樣靜靜地躺著,像睡著了一般膳凝。 火紅的嫁衣襯著肌膚如雪碑隆。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,775評論 1 307
  • 那天鸠项,我揣著相機與錄音干跛,去河邊找鬼。 笑死祟绊,一個胖子當著我的面吹牛楼入,可吹牛的內容都是我干的。 我是一名探鬼主播牧抽,決...
    沈念sama閱讀 40,474評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼嘉熊,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了扬舒?” 一聲冷哼從身側響起阐肤,我...
    開封第一講書人閱讀 39,359評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎讲坎,沒想到半個月后孕惜,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 45,854評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡晨炕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,007評論 3 338
  • 正文 我和宋清朗相戀三年衫画,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片瓮栗。...
    茶點故事閱讀 40,146評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡削罩,死狀恐怖,靈堂內的尸體忽然破棺而出费奸,到底是詐尸還是另有隱情弥激,我是刑警寧澤,帶...
    沈念sama閱讀 35,826評論 5 346
  • 正文 年R本政府宣布愿阐,位于F島的核電站微服,受9級特大地震影響,放射性物質發(fā)生泄漏换况。R本人自食惡果不足惜职辨,卻給世界環(huán)境...
    茶點故事閱讀 41,484評論 3 331
  • 文/蒙蒙 一盗蟆、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧舒裤,春花似錦喳资、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,029評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至伴鳖,卻和暖如春节值,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背榜聂。 一陣腳步聲響...
    開封第一講書人閱讀 33,153評論 1 272
  • 我被黑心中介騙來泰國打工搞疗, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人须肆。 一個月前我還...
    沈念sama閱讀 48,420評論 3 373
  • 正文 我出身青樓匿乃,卻偏偏與公主長得像,于是被迫代替她去往敵國和親豌汇。 傳聞我的和親對象是個殘疾皇子幢炸,可洞房花燭夜當晚...
    茶點故事閱讀 45,107評論 2 356