聚類分析巩检、判別分析厚骗、主成分分析、因子分析

來自:帶呀帶尾呀(數(shù)據(jù)小生兢哭、數(shù)字營銷领舰、新媒體)

主成分分析與因子分析的區(qū)別

1. 目的不同: 因子分析把諸多變量看成由對每一個變量都有作用的一些公共因子和僅對某一個變量有作用的特殊因子線性組合而成,因此就是要從數(shù)據(jù)中控查出對變量起解釋作用的公共因子和特殊因子以及其組合系數(shù);主成分分析只是從空間生成的角度尋找能解釋諸多變量變異的絕大部分的幾組彼此不相關(guān)的新變量(主成分)冲秽。

2. 線性表示方向不同: 因子分析是把變量表示成各公因子的線性組合舍咖;而主成分分析中則是把主成分表示成各變量的線性組合。

3. 假設(shè)條件不同:主成分分析中不需要有假設(shè)锉桑;因子分析的假設(shè)包括:各個公共因子之間不相關(guān)排霉,特殊因子之間不相關(guān),公共因子和特殊因子之間不相關(guān)民轴。

4. 提取主因子的方法不同:因子分析抽取主因子不僅有主成分法攻柠,還有極大似然法,主軸因子法后裸,基于這些方法得到的結(jié)果也不同瑰钮;主成分只能用主成分法抽取。

5. 主成分與因子的變化:當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值唯一時微驶,主成分一般是固定的浪谴;而因子分析中因子不是固定的,可以旋轉(zhuǎn)得到不同的因子因苹。

6. 因子數(shù)量與主成分的數(shù)量:在因子分析中苟耻,因子個數(shù)需要分析者指定(SPSS根據(jù)一定的條件自動設(shè)定,只要是特征值大于1的因子主可進(jìn)入分析)扶檐,指定的因子數(shù)量不同而結(jié)果也不同梁呈;在主成分分析中,成分的數(shù)量是一定的蘸秘,一般有幾個變量就有幾個主成分(只是主成分所解釋的信息量不等)官卡。

7. 功能:和主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子醋虏,在解釋方面更加有優(yōu)勢寻咒;而如果想把現(xiàn)有的變量變成少數(shù)幾個新的變量(新的變量幾乎帶有原來所有變量的信息)來進(jìn)入后續(xù)的分析,則可以使用主成分分析颈嚼。當(dāng)然毛秘,這種情況也可以使用因子得分做到,所以這種區(qū)分不是絕對的阻课。

1 叫挟、聚類分析

基本原理:將個體(樣品)或者對象(變量)按相似程度(距離遠(yuǎn)近)劃分類別,使得同一類中的元素之間的相似性比其他類的元素的相似性更強(qiáng)限煞。目的在于使類間元素的同質(zhì)性最大化和類與類間元素的異質(zhì)性最大化抹恳。

常用聚類方法:系統(tǒng)聚類法,K-均值法署驻,模糊聚類法奋献,有序樣品的聚類健霹,分解法,加入法瓶蚂。

注意事項(xiàng):1. 系統(tǒng)聚類法可對變量或者記錄進(jìn)行分類糖埋,K-均值法只能對記錄進(jìn)行分類;

2. K-均值法要求分析人員事先知道樣品分為多少類窃这;

3. 對變量的多元正態(tài)性瞳别,方差齊性等要求較高。

應(yīng)用領(lǐng)域:細(xì)分市場杭攻,消費(fèi)行為劃分祟敛,設(shè)計(jì)抽樣方案等

2、判別分析

基本原理:從已知的各種分類情況中總結(jié)規(guī)律(訓(xùn)練出判別函數(shù))朴上,當(dāng)新樣品進(jìn)入時,判斷其與判別函數(shù)之間的相似程度(概率最大卒煞,距離最近痪宰,離差最小等判別準(zhǔn)則)。

常用判別方法:最大似然法畔裕,距離判別法衣撬,F(xiàn)isher判別法,Bayes判別法扮饶,逐步判別法等具练。

注意事項(xiàng):1. 判別分析的基本條件:分組類型在兩組以上,解釋變量必須是可測的甜无;

2. 每個解釋變量不能是其它解釋變量的線性組合(比如出現(xiàn)多重共線性情況時扛点,判別權(quán)重會出現(xiàn)問題);

3. 各解釋變量之間服從多元正態(tài)分布(不符合時岂丘,可使用Logistic回歸替代)陵究,且各組解釋變量的協(xié)方差矩陣相等(各組協(xié)方方差矩陣有顯著差異時,判別函數(shù)不相同)奥帘。

相對而言铜邮,即使判別函數(shù)違反上述適用條件,也很穩(wěn)健寨蹋,對結(jié)果影響不大松蒜。

應(yīng)用領(lǐng)域:對客戶進(jìn)行信用預(yù)測,尋找潛在客戶(是否為消費(fèi)者已旧,公司是否成功秸苗,學(xué)生是否被錄用等等),臨床上用于鑒別診斷运褪。

3难述、 主成分分析/ 因子分析

主成分分析基本原理:利用降維(線性變換)的思想萤晴,在損失很少信息的前提下把多個指標(biāo)轉(zhuǎn)化為幾個綜合指標(biāo)(主成分),即每個主成分都是原始變量的線性組合,且各個主成分之間互不相關(guān),使得主成分比原始變量具有某些更優(yōu)越的性能(主成分必須保留原始變量90%以上的信息),從而達(dá)到簡化系統(tǒng)結(jié)構(gòu)胁后,抓住問題實(shí)質(zhì)的目的店读。

因子分析基本原理:利用降維的思想,由研究原始變量相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā)攀芯,把一些具有錯綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個綜合因子屯断。(因子分析是主成分的推廣,相對于主成分分析侣诺,更傾向于描述原始變量之間的相關(guān)關(guān)系)

求解主成分的方法:從協(xié)方差陣出發(fā)(協(xié)方差陣已知)殖演,從相關(guān)陣出發(fā)(相關(guān)陣R已知)。

(實(shí)際研究中年鸳,總體協(xié)方差陣與相關(guān)陣是未知的趴久,必須通過樣本數(shù)據(jù)來估計(jì))

求解因子載荷的方法:主成分法,主軸因子法搔确,極大似然法彼棍,最小二乘法,a因子提取法膳算。

注意事項(xiàng):1. 由協(xié)方差陣出發(fā)與由相關(guān)陣出發(fā)求解主成分所得結(jié)果不一致時座硕,要恰當(dāng)?shù)倪x取某一種方法;

2. 對于度量單位或是取值范圍在同量級的數(shù)據(jù)涕蜂,可直接求協(xié)方差陣华匾;對于度量單位不同的指標(biāo)或是取值范圍彼此差異非常大的指標(biāo),應(yīng)考慮將數(shù)據(jù)標(biāo)準(zhǔn)化机隙,再由協(xié)方差陣求主成分蜘拉;

3.主成分分析不要求數(shù)據(jù)來源于正態(tài)分布;

4. 在選取初始變量進(jìn)入分析時應(yīng)該特別注意原始變量是否存在多重共線性的問題(最小特征根接近于零有鹿,說明存在多重共線性問題)诸尽。

5. 因子分析中各個公共因子之間不相關(guān),特殊因子之間不相關(guān)印颤,公共因子和特殊因子之間不相關(guān)您机。

應(yīng)用領(lǐng)域:解決共線性問題,評價問卷的結(jié)構(gòu)效度年局,尋找變量間潛在的結(jié)構(gòu)际看,內(nèi)在結(jié)構(gòu)證實(shí)。

4矢否、對應(yīng)分析/最優(yōu)尺度分析

基本原理:利用降維的思想以達(dá)到簡化數(shù)據(jù)結(jié)構(gòu)的目的仲闽,同時對數(shù)據(jù)表中的行與列進(jìn)行處理,尋求以低維圖形表示數(shù)據(jù)表中行與列之間的關(guān)系僵朗。

對應(yīng)分析:用于展示變量(兩個/多個分類)間的關(guān)系(變量的分類數(shù)較多時較佳)赖欣;

最優(yōu)尺度分析:可同時分析多個變量間的關(guān)系屑彻,變量的類型可以是無序多分類,有序多分類或連續(xù)性變量顶吮,并 對多選題的分析提供了支持社牲。

5、典型相關(guān)分析

基本原理:借用主成分分析降維的思想悴了,分別對兩組變量提取主成分搏恤,且使從兩組變量提取的主成分之間的相關(guān)程度達(dá)到最大,而從同一組內(nèi)部提取的各主成分之間互不相關(guān)湃交。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末熟空,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子搞莺,更是在濱河造成了極大的恐慌息罗,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,723評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件才沧,死亡現(xiàn)場離奇詭異迈喉,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)糜工,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評論 2 382
  • 文/潘曉璐 我一進(jìn)店門弊添,熙熙樓的掌柜王于貴愁眉苦臉地迎上來录淡,“玉大人捌木,你說我怎么就攤上這事〖灯荩” “怎么了刨裆?”我有些...
    開封第一講書人閱讀 152,998評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長彬檀。 經(jīng)常有香客問我帆啃,道長,這世上最難降的妖魔是什么窍帝? 我笑而不...
    開封第一講書人閱讀 55,323評論 1 279
  • 正文 為了忘掉前任努潘,我火速辦了婚禮,結(jié)果婚禮上坤学,老公的妹妹穿的比我還像新娘疯坤。我一直安慰自己,他們只是感情好深浮,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,355評論 5 374
  • 文/花漫 我一把揭開白布压怠。 她就那樣靜靜地躺著,像睡著了一般飞苇。 火紅的嫁衣襯著肌膚如雪菌瘫。 梳的紋絲不亂的頭發(fā)上蜗顽,一...
    開封第一講書人閱讀 49,079評論 1 285
  • 那天,我揣著相機(jī)與錄音雨让,去河邊找鬼雇盖。 笑死,一個胖子當(dāng)著我的面吹牛宫患,可吹牛的內(nèi)容都是我干的刊懈。 我是一名探鬼主播,決...
    沈念sama閱讀 38,389評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼娃闲,長吁一口氣:“原來是場噩夢啊……” “哼虚汛!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起皇帮,我...
    開封第一講書人閱讀 37,019評論 0 259
  • 序言:老撾萬榮一對情侶失蹤卷哩,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后属拾,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體将谊,經(jīng)...
    沈念sama閱讀 43,519評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,971評論 2 325
  • 正文 我和宋清朗相戀三年渐白,在試婚紗的時候發(fā)現(xiàn)自己被綠了尊浓。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,100評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡纯衍,死狀恐怖栋齿,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情襟诸,我是刑警寧澤瓦堵,帶...
    沈念sama閱讀 33,738評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站歌亲,受9級特大地震影響菇用,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜陷揪,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,293評論 3 307
  • 文/蒙蒙 一惋鸥、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧悍缠,春花似錦卦绣、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至玷坠,卻和暖如春蜗搔,著一層夾襖步出監(jiān)牢的瞬間劲藐,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評論 1 262
  • 我被黑心中介騙來泰國打工樟凄, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留聘芜,地道東北人。 一個月前我還...
    沈念sama閱讀 45,547評論 2 354
  • 正文 我出身青樓缝龄,卻偏偏與公主長得像汰现,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子叔壤,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,834評論 2 345

推薦閱讀更多精彩內(nèi)容