判別分析及R使用Part2-距離判別法

這部分筆記是MOOC課程《多元統(tǒng)計(jì)分析及R語(yǔ)言建姆诺洌》第6章第二講“距離判別分析”晒衩。在判別分析及R使用-Part1中提到涌攻,確定性判別可用Fisher判別法逛绵,除此之外還可以用距離判別分析怀各。

兩總體距離判別

老師在講課的時(shí)候畫了張圖,可以直觀的理解什么是距離判別法:

設(shè)μ_1术浪,μ_2瓢对,∑_1∑_2分別為兩個(gè)類G_1胰苏,G_2的均值向量和協(xié)方差矩陣硕蛹。

距離判別.jpeg

簡(jiǎn)單來(lái)講,若想知道一個(gè)樣本x屬于哪個(gè)總體硕并,可以計(jì)算并比較x到兩個(gè)總體的距離法焰,距離誰(shuí)近則屬于誰(shuí)。距離計(jì)算方法用的是馬氏距離
D(X,G_i)=(X - μ_i)'(∑_i)^{-1}(X-μ_i)倔毙,i=1,2
判別準(zhǔn)則:

  • 當(dāng)D(X,G_1) < D(X,G_2)埃仪,則X ∈ G_1
  • 當(dāng)D(X,G_1) > D(X,G_2),則X ∈ G_2
  • 當(dāng)D(X,G_1) = D(X,G_2)陕赃,待判卵蛉。

按照∑_1∑_2是否相等,距離判別分析又可分為直線判別曲線判別凯正。

直線判別

當(dāng)∑_1=∑_2=∑時(shí)毙玻,就是直線判別。若想知道一個(gè)未知的點(diǎn)距離誰(shuí)近廊散,可以做減法:
W(X)=D(X,G_2)-D(X,G_1) \\=(X - μ_2)'∑^{-1}(X-μ_2)-(X - μ_1)'∑^{-1}(X-μ_1)\\=2X'∑^{-1}(μ_1-μ_2)-(μ_1+μ_2)∑^{-1}(μ_1-μ_2)\\=2[X-1/2(μ_1+μ_2)]'∑^{-1}(μ_1-μ_2)
然后把無(wú)傷大雅的2去掉桑滩,就可以把W(X)寫成b_0+b_1X,此時(shí)b_0=-1/2(μ_1+μ_2)'∑^{-1}(μ_1-μ_2)允睹,b_1=∑^{-1}(μ_1-μ_2)运准。這個(gè)b_1其實(shí)就是Fisher判別分析里的\alpha',換句話說缭受,當(dāng)兩總體協(xié)方差矩陣相等時(shí)胁澳,距離判別分析和Fisher判別分析是一樣的。

其實(shí)吧米者,上面公式是怎么推倒的韭畸,我還沒整的特別明白宇智,先記錄下來(lái),回頭再扣

曲線判別

曲線判別就是∑_1≠∑_2時(shí)的情況胰丁,不等則不能像相等時(shí)將∑代入展開:
W(X)=D(X,G_2)-D(X,G_1) \\=(X - μ_2)'∑^{-1}(X-μ_2)-(X - μ_1)'∑^{-1}(X-μ_1)

舉例說明

還是之前的天氣的例子随橘,這回我們使用距離判別分析天氣數(shù)據(jù),在R語(yǔ)言中使用qda()函數(shù)即可:

> qd <- qda(G~x1+x2)
> qp<- predict(qd)
> G2 <- qp$class
> data.frame(G,G1,G2)##G1是使用Fisher判別法時(shí)預(yù)測(cè)的結(jié)果锦庸,不明白的可以去看上一張筆記的內(nèi)容
  G G1 G2
1  1  1  2
2  1  1  1
3  1  1  1
4  1  1  1
5  1  1  1
6  1  2  1
7  1  1  1
8  1  1  1
9  1  1  1
10 1  1  1
11 2  2  2
12 2  2  2
13 2  2  2
14 2  2  2
15 2  1  1
16 2  2  1
17 2  2  2
18 2  2  2
19 2  2  2
20 2  2  2
##計(jì)算正確率
> sum(diag(prop.table( table(G,G2))))
[1] 0.85
##做天氣預(yù)測(cè)
> predict(qd,data.frame(x1=8.1,x2=2.0))
$class
[1] 1
Levels: 1 2

$posterior
          1           2
1 0.9939952 0.006004808

多總體距離判別

多總體時(shí)就不能像兩總體那樣做距離的減法了机蔗,需要帶著i對(duì)公式進(jìn)行下變換,若協(xié)方差矩陣相同(直線判別):
D(X,G_i)=(X - μ_i)'∑^{-1}(X-μ_i)\\=X'∑^{-1}X- 2μ_i'∑^{-1}X+μ_i'∑^{-1}μ_i\\ =X'∑^{-1}X-2(b_iX+b_0)\\=X'∑^{-1}X-2Z_i
其中甘萧,Z_i=b_0+b_iX萝嘁,當(dāng)Z_i=max(Z_j),i≤j≤k扬卷,則X ∈ G_i牙言。
而協(xié)方差矩陣若不相等(非線性判別),則馬氏距離公式無(wú)法展開D(X,G_i)=(X - μ_i)'∑^{-1}(X-μ_i)邀泉,此時(shí)是當(dāng)D(x,G_i)=min D(X,G_i)嬉挡,i≤j≤k時(shí),X ∈ G_i汇恤。

舉例說明

表6.3.png

20個(gè)電視機(jī)庞钢,5種暢銷,8種平銷因谎,7種滯銷基括,試建立判別函數(shù),當(dāng)一新產(chǎn)品其質(zhì)量評(píng)分為8.0财岔,功能評(píng)分為7.5风皿,銷售價(jià)格為65元,問該廠產(chǎn)品的銷售前景如何匠璧?
首先使用直線判別:

> d6.3 <- read.xlsx("/home/my/桌面/MOOC/多元統(tǒng)計(jì)分析/mvstats5.xlsx",sheet="d6.3")
> d6.3
     Q   C  P G3
1  8.3 4.0 29  1
2  9.5 7.0 68  1
3  8.0 5.0 39  1
4  7.4 7.0 50  1
5  8.8 6.5 55  1
6  9.0 7.5 58  2
7  7.0 6.0 75  2
8  9.2 8.0 82  2
9  8.0 7.0 67  2
10 7.6 9.0 90  2
11 7.2 8.5 86  2
12 6.4 7.0 53  2
13 7.3 5.0 48  2
14 6.0 2.0 20  3
15 6.4 4.0 39  3
16 6.8 5.0 48  3
17 5.2 3.0 29  3
18 5.8 3.5 32  3
19 5.5 4.0 34  3
20 6.0 4.5 36  3
> attach(d6.3)
> ld3 <- lda(G3~Q+C+P)
> ld3
Call:
lda(G3 ~ Q + C + P)

Prior probabilities of groups:
   1    2    3 
0.25 0.40 0.35 

Group means:
         Q        C      P
1 8.400000 5.900000 48.200
2 7.712500 7.250000 69.875
3 5.957143 3.714286 34.000

Coefficients of linear discriminants:
          LD1         LD2
Q -0.81173396  0.88406311
C -0.63090549  0.20134565
P  0.01579385 -0.08775636

Proportion of trace:
   LD1    LD2 
0.7403 0.2597 
> lp3<- predict(ld3)
> lG3 <- lp3$class
> data.frame(G3,lG3)
   G3 lG3
1   1   1
2   1   1
3   1   1
4   1   1
5   1   1
6   2   1
7   2   2
8   2   2
9   2   2
10  2   2
11  2   2
12  2   2
13  2   3
14  3   3
15  3   3
16  3   3
17  3   3
18  3   3
19  3   3
20  3   3
> ltab3 <- table(G3,lG3)
> ltab3
   lG3
G3  1 2 3
  1 5 0 0
  2 1 6 1
  3 0 0 7
> plot(lp3$x)
> text(lp3$x[,1],lp3$x[,2],lG3,adj=-0.8,cex=0.75)
lp3.png
> predict(ld3,data.frame(Q=8,C=7.5,P=65))
$class
[1] 2
Levels: 1 2 3

$posterior
          1        2           3
1 0.2114514 0.786773 0.001775594

$x
        LD1        LD2
1 -1.537069 -0.1367865

若協(xié)方差矩陣不等桐款,使用pda()函數(shù):

> qd3 <- qda(G3~Q+C+P)
> qd3
Call:
qda(G3 ~ Q + C + P)

Prior probabilities of groups:
   1    2    3 
0.25 0.40 0.35 

Group means:
         Q        C      P
1 8.400000 5.900000 48.200
2 7.712500 7.250000 69.875
3 5.957143 3.714286 34.000
> qp3 <- predict(qd3)
> qG3 <- qp3$class
> data.frame(G3,lG3,qG3)
   G3 lG3 qG3
1   1   1   1
2   1   1   1
3   1   1   1
4   1   1   1
5   1   1   1
6   2   1   2
7   2   2   2
8   2   2   2
9   2   2   2
10  2   2   2
11  2   2   2
12  2   2   2
13  2   3   3
14  3   3   3
15  3   3   3
16  3   3   3
17  3   3   3
18  3   3   3
19  3   3   3
20  3   3   3
> qtab3<-table(G3,lG3)
> predict(qd3,data.frame(Q=8,C=7.5,P=6.5))
$class
[1] 2
Levels: 1 2 3

$posterior
              1 2             3
1 5.080497e-225 1 1.498709e-158

無(wú)論哪種方法,正確率大于0.8就是可以的夷恍。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末魔眨,一起剝皮案震驚了整個(gè)濱河市答倡,隨后出現(xiàn)的幾起案子请垛,更是在濱河造成了極大的恐慌,老刑警劉巖衷模,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件指黎,死亡現(xiàn)場(chǎng)離奇詭異朋凉,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)醋安,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門杂彭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)墓毒,“玉大人,你說我怎么就攤上這事盖灸∫媳睿” “怎么了磺芭?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵赁炎,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我钾腺,道長(zhǎng)徙垫,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任放棒,我火速辦了婚禮姻报,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘间螟。我一直安慰自己吴旋,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布厢破。 她就那樣靜靜地躺著荣瑟,像睡著了一般。 火紅的嫁衣襯著肌膚如雪摩泪。 梳的紋絲不亂的頭發(fā)上笆焰,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天,我揣著相機(jī)與錄音见坑,去河邊找鬼嚷掠。 笑死,一個(gè)胖子當(dāng)著我的面吹牛荞驴,可吹牛的內(nèi)容都是我干的不皆。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼熊楼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼霹娄!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起孙蒙,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤项棠,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后挎峦,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體香追,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年坦胶,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了透典。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片晴楔。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖峭咒,靈堂內(nèi)的尸體忽然破棺而出税弃,到底是詐尸還是另有隱情,我是刑警寧澤凑队,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布则果,位于F島的核電站,受9級(jí)特大地震影響漩氨,放射性物質(zhì)發(fā)生泄漏西壮。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一叫惊、第九天 我趴在偏房一處隱蔽的房頂上張望款青。 院中可真熱鬧,春花似錦霍狰、人聲如沸抡草。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)康震。三九已至,卻和暖如春步悠,著一層夾襖步出監(jiān)牢的瞬間签杈,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工鼎兽, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留答姥,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓谚咬,卻偏偏與公主長(zhǎng)得像鹦付,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子择卦,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容