11.2.1因子分析操作
打開數(shù)據(jù)文件--分析--降維--因子--因子分析--
將網(wǎng)點(diǎn)劉瀏覽量,論壇瀏覽,線上廣告費(fèi)用姊途,地面推廣引入量,線下廣告費(fèi)用奈惑,實(shí)體店鋪貨量吭净,實(shí)體店訪客數(shù)-移置變量中(作為待分析的變量)--描述--因子分析描述--勾選最后的一個(gè)【KMO和巴特利特球形度檢驗(yàn)】(用于生成檢驗(yàn)因子分析師和度的統(tǒng)計(jì)指標(biāo))--繼續(xù)
--提取--因子分析;提取--方法--主成分--碎石圖(輔助判斷銀子個(gè)數(shù))--繼續(xù)
旋轉(zhuǎn)--因子分析旋轉(zhuǎn)--最大方差法(用于更好的解釋因子所包含的意義)--繼續(xù)
注釋:在這里常用“最大方差法”該方法能夠使用盡可能在一個(gè)因子上有較高的載荷,在其余的因子上載荷較小肴甸,從而方便對(duì)因子進(jìn)行解析
--選項(xiàng)--【因子分析選項(xiàng)】--系數(shù)顯示格式--按大小排序--排除小系數(shù)--【絕對(duì)值如下】礦中輸入40(更清晰的顯式因子載荷寂殉,方便因子的解釋和命名)--繼續(xù)
--確定(開始運(yùn)行因子分析)
11.2.2因子分習(xí)結(jié)果解讀
KMO和巴特利特檢驗(yàn)(該結(jié)果用來檢驗(yàn)數(shù)據(jù)是否適合因子分析,主要參考KMO統(tǒng)計(jì)量即可)
本例中KMO統(tǒng)計(jì)量為0.627原在,結(jié)余0.5和0.7之間友扰,說明該數(shù)據(jù)尚可進(jìn)行因子分析
第二個(gè)輸出結(jié)果是:公因子方差,也就是變量共同度(該結(jié)果顯示了原始變量能被提取的因子表示的程度庶柿,同時(shí)顯示了提取因子的方法)
本例中村怪,所有變量的共同度都是60%以上,可以認(rèn)為所提取的因子對(duì)各變量的解釋能力是可以接受的
第三個(gè)輸出結(jié)果是:總方差解釋(該結(jié)果顯示了通過i分析所提取的因子數(shù)量浮庐,以及所提取的因子對(duì)所有變量的累計(jì)方差貢獻(xiàn)率甚负。一般情況下,累計(jì)方差貢獻(xiàn)率達(dá)到60%以上审残,則說明因子對(duì)變量的解釋能力上課接受梭域,達(dá)到80%及以上,說明因子對(duì)變量的解釋能力非常好
本例中搅轿,根據(jù)“初始值”大于1的標(biāo)準(zhǔn)提取了倆個(gè)因子病涨,選好轉(zhuǎn)后倆個(gè)因子的方差貢獻(xiàn)率略有變化,差距有所縮小璧坟,累計(jì)方差貢獻(xiàn)率為72.367%既穆,和旋轉(zhuǎn)前一樣赎懦,相對(duì)來說,因子的解釋能力比較好
第四個(gè)輸出結(jié)果是:“碎石圖”(該結(jié)果能狗輔助判斷最佳因子個(gè)數(shù)幻工,通常是選取曲線中較陡的位置所對(duì)引得因子個(gè)數(shù))
本例中励两,前三個(gè)因子都在陡峭的曲線上,所以提取2-3個(gè)依著你都可以對(duì)原始變量的信息有較好的解釋囊颅。
---
如何確定提取的因子個(gè)數(shù)
標(biāo)準(zhǔn):
初始特征值(輸出3的第二列數(shù)字)大于1 的因子個(gè)數(shù)
累計(jì)方差貢獻(xiàn)率(輸出3中第四列的數(shù)字)達(dá)到一定水平(如60%)的因子個(gè)數(shù)
碎石圖中處于較陡曲線上所對(duì)應(yīng)的因子個(gè)數(shù)
依據(jù)對(duì)研究事物的理解而制定的因子個(gè)數(shù)
--
本例中將根據(jù)Spss因子分析結(jié)果提取的倆個(gè)因子進(jìn)行后續(xù)分析
第五個(gè)輸出結(jié)果是:“成分矩陣”該結(jié)果顯示的是旋轉(zhuǎn)錢的因子載荷矩陣伐蒋,其中有些變量在各個(gè)因子上的載荷比較接近,難以對(duì)因子進(jìn)行明確定義迁酸,因此先鱼,對(duì)因子解釋和命名更有知道的意義的是旋轉(zhuǎn)后的成分矩陣
本例中,“網(wǎng)站瀏覽量”在倆個(gè)因子刪的載荷較為接近奸鬓,所以要關(guān)注該變量在因子旋轉(zhuǎn)后的載荷焙畔,以便正確解讀因子的含義
第六個(gè)輸出的結(jié)果是:“旋轉(zhuǎn)后的成分矩陣”該結(jié)果顯示的是旋轉(zhuǎn)后的載荷矩陣,這個(gè)結(jié)果能夠凸顯因子的含義串远,易于理解
本例中宏多,通過訊轉(zhuǎn)后的因子載荷矩陣:
第一個(gè)因子,載荷較大的變量是“網(wǎng)站瀏覽量澡罚,論壇瀏覽量伸但,線上廣告費(fèi)用,實(shí)體店訪客數(shù)”說明他們四個(gè)變量與該因子的相關(guān)程度較高留搔,其中“網(wǎng)點(diǎn)瀏覽量”“論壇瀏覽量”“線上廣告費(fèi)用”三個(gè)變量梵音的是線上情況更胖,而實(shí)體店訪客數(shù),變量雖然梵音的是線下情況隔显,但其在和值符號(hào)為負(fù)號(hào)却妨,顯然,改變兩個(gè)與第一個(gè)因子成反向關(guān)系括眠,綜上所述彪标,可降低一個(gè)引自命名為“線上商務(wù)”因子
第二個(gè)因子,載荷較大的變量是“實(shí)體店鋪貨量”掷豺,線下廣告費(fèi)用和地面及推廣引入流量
說明他們?nèi)齻€(gè)便令與該因子的先關(guān)的程度較高捞烟,并且這些變量梵音的線下情況,因此当船,可以將第二個(gè)因子上有數(shù)值
第七個(gè)輸出結(jié)果是:成分轉(zhuǎn)換矩陣题画,該結(jié)果顯示了右旋轉(zhuǎn)之前因子載荷矩陣轉(zhuǎn)換到新旋轉(zhuǎn)之后因子載荷矩陣所需要香橙的矩陣系數(shù),對(duì)結(jié)果解讀的實(shí)用性不高生年,可以忽略
-------------------
對(duì)因子的分進(jìn)行評(píng)價(jià)
需要考慮每個(gè)因子的方差貢獻(xiàn)率占總累計(jì)方差共吸納了的比率de 比例婴程,一次作為權(quán)重廓奕,進(jìn)行加權(quán)計(jì)算
--轉(zhuǎn)換--計(jì)算變量--目標(biāo)變量--綜合得分--數(shù)字表達(dá)式--(38.968/72.367*fac1_1+33.399/72.367*FAC2_1)--確定
將該綜合得分從高到低進(jìn)行降序排列抱婉,就能知道那些商戶在o2o的運(yùn)營方式下的表現(xiàn)優(yōu)異档叔,排序后的結(jié)果如圖
通過對(duì)7個(gè)原始變量個(gè)進(jìn)行因子分析,最后輸出倆個(gè)因子蒸绩,分別是“線上商務(wù)”和“線下商務(wù)”倆個(gè)因子衙四,然后集散總和得分,根據(jù)計(jì)算綜合得分患亿,根據(jù)最后總和得分的排名传蹈,得知商戶17,28,和31為o2o運(yùn)營方式下表現(xiàn)優(yōu)異的前三甲步藕。