3. SPSS基本使用:數(shù)據(jù)規(guī)范化

一、數(shù)據(jù)轉(zhuǎn)化

image.png
1. 數(shù)據(jù)形態(tài)轉(zhuǎn)化

1)分類(lèi)字段轉(zhuǎn)化為連續(xù)字段页徐,比如汽車(chē)的顏色苏潜,白色黑色需求會(huì)較多,紅色或者其他顏色需求少变勇,因此我們排序后可以給顏色賦值恤左,比如白色1,黑色2贰锁,其他顏色依次類(lèi)推赃梧。 但是一個(gè)很關(guān)鍵的地方就是,分誒字段想要轉(zhuǎn)化為連續(xù)字段豌熄,必須是有等級(jí)有序的授嘀,否則沒(méi)有意義。
2)數(shù)據(jù)離散化锣险,把所有人年齡分成90后蹄皱,80后,因?yàn)槲覀冄芯客活?lèi)型的特點(diǎn)芯肤。

2. 數(shù)據(jù)標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)化的目的就是消除量綱
1)極值標(biāo)準(zhǔn)化巷折,就是把所有值轉(zhuǎn)化為固定區(qū)間,比如(0,100)來(lái)衡量
2)這個(gè)最常用

3. 數(shù)據(jù)一般化:主要是針對(duì)分類(lèi)數(shù)據(jù)崖咨,有時(shí)候分類(lèi)數(shù)據(jù)很多锻拘,我們可以減少一些分類(lèi)數(shù)據(jù),比如地址信息很詳細(xì)击蹲,但我們不需要這么詳細(xì)署拟,可以直接忽略街道這些信息而只關(guān)注整個(gè)城市

二、數(shù)據(jù)離散化與數(shù)據(jù)擴(kuò)充

image.png

目的
1)3)本質(zhì)上就是看看離散化后能不能讓模型跑出結(jié)果歌豺,原來(lái)跑不出來(lái)推穷,離散了以后看看有沒(méi)有一些關(guān)系,比如線性關(guān)系类咧。
2)這個(gè)點(diǎn)不對(duì)馒铃,一般能用連續(xù)數(shù)值型盡量用連續(xù)數(shù)值型蟹腾,只有說(shuō)我們不需要這么精確,才會(huì)轉(zhuǎn)化為離散型數(shù)值区宇,而不是為了配合模型娃殖,先有分析目標(biāo),再有模型


image.png

等寬箱子其實(shí)就是最大值-最小值/組數(shù) 得到組距萧锉,上面圖片組距是3
等分箱子就是每個(gè)間隔箱子個(gè)數(shù)都一樣
實(shí)際操作過(guò)程中我們可以嘗試性的用上述的分法珊随,然后跑下模型,看看效果好不好柿隙。


image.png

數(shù)據(jù)擴(kuò)充簡(jiǎn)單了,看下ppt

三鲫凶、數(shù)據(jù)合并與拆分

image.png

理論部分如上圖

1) 數(shù)據(jù)合并
image.png

重新獲取telco.sav文件打開(kāi)禀崖,第一步我們先生成一部分額外的數(shù)據(jù)集
可以通過(guò)選擇個(gè)案按鈕-隨機(jī)個(gè)案樣本,這一步我們添加10%個(gè)案螟炫,然后復(fù)制數(shù)據(jù)到新數(shù)據(jù)集波附,命名為合并。


image.png

第二步開(kāi)始合并昼钻,我們點(diǎn)擊數(shù)據(jù)按鈕-選擇合并文件-添加個(gè)案-打開(kāi)數(shù)據(jù)集-選中剛才的合并-點(diǎn)擊繼續(xù)


image.png

只是個(gè)案源打鉤
image.png

可以看到多了100多條數(shù)據(jù)掸屡,并且多了個(gè)字段叫做source,原文件是0然评,新文件來(lái)的是1仅财,合并完成
  1. 變量數(shù)據(jù)合并


    image.png

    這里還有一個(gè)合并變量按鈕,其實(shí)就是按健值合并碗淌,這一部分其實(shí)直接用sql更加簡(jiǎn)單盏求。
    3)內(nèi)部數(shù)據(jù)擴(kuò)充


    image.png

    這一步其實(shí)就是計(jì)算字段,給表內(nèi)通過(guò)計(jì)算的方式增加計(jì)算字段亿眠。
    點(diǎn)擊轉(zhuǎn)換按鈕-計(jì)算變量-我們要計(jì)算家庭人均收入碎罚,在目標(biāo)變量里面輸入家庭人均收入,在數(shù)字表達(dá)式里面輸入income/reside-點(diǎn)擊確定
    image.png

    結(jié)果如上纳像,多了一列家庭人均收入

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末荆烈,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子竟趾,更是在濱河造成了極大的恐慌憔购,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,686評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件潭兽,死亡現(xiàn)場(chǎng)離奇詭異倦始,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)山卦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,668評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)鞋邑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)诵次,“玉大人,你說(shuō)我怎么就攤上這事枚碗∮庖唬” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 158,160評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵肮雨,是天一觀的道長(zhǎng)遵堵。 經(jīng)常有香客問(wèn)我,道長(zhǎng)怨规,這世上最難降的妖魔是什么陌宿? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,736評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮波丰,結(jié)果婚禮上壳坪,老公的妹妹穿的比我還像新娘。我一直安慰自己掰烟,他們只是感情好爽蝴,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,847評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著纫骑,像睡著了一般蝎亚。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上先馆,一...
    開(kāi)封第一講書(shū)人閱讀 50,043評(píng)論 1 291
  • 那天发框,我揣著相機(jī)與錄音,去河邊找鬼磨隘。 笑死缤底,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的番捂。 我是一名探鬼主播个唧,決...
    沈念sama閱讀 39,129評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼设预!你這毒婦竟也來(lái)了徙歼?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,872評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤鳖枕,失蹤者是張志新(化名)和其女友劉穎魄梯,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體宾符,經(jīng)...
    沈念sama閱讀 44,318評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡酿秸,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,645評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了魏烫。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片辣苏。...
    茶點(diǎn)故事閱讀 38,777評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡肝箱,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出稀蟋,到底是詐尸還是另有隱情煌张,我是刑警寧澤,帶...
    沈念sama閱讀 34,470評(píng)論 4 333
  • 正文 年R本政府宣布退客,位于F島的核電站骏融,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏萌狂。R本人自食惡果不足惜档玻,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,126評(píng)論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望粥脚。 院中可真熱鬧窃肠,春花似錦、人聲如沸刷允。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,861評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)树灶。三九已至,卻和暖如春糯而,著一層夾襖步出監(jiān)牢的瞬間天通,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,095評(píng)論 1 267
  • 我被黑心中介騙來(lái)泰國(guó)打工熄驼, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留像寒,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,589評(píng)論 2 362
  • 正文 我出身青樓瓜贾,卻偏偏與公主長(zhǎng)得像诺祸,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子祭芦,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,687評(píng)論 2 351

推薦閱讀更多精彩內(nèi)容

  • 第三章 數(shù)據(jù)庫(kù)系統(tǒng) 3.1 數(shù)據(jù)庫(kù)管理系統(tǒng)的類(lèi)型 通常有多個(gè)分類(lèi)標(biāo)準(zhǔn)筷笨。如按數(shù)據(jù)模型分類(lèi)、按用戶數(shù)分類(lèi)龟劲、按數(shù)據(jù)庫(kù)分布...
    步積閱讀 2,694評(píng)論 0 7
  • 0胃夏、前言 數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)的上限,而模型和算法只是逼近這個(gè)上限而已昌跌。 由此可見(jiàn)仰禀,特征工程在機(jī)器學(xué)習(xí)中占有相...
    從來(lái)只看自己_7faa閱讀 1,296評(píng)論 0 0
  • 最近時(shí)常思考人活著究竟是為了什么,人生為何如此的艱難蚕愤?每每想此類(lèi)問(wèn)題的時(shí)候答恶,我都會(huì)覺(jué)得很奇怪饺蚊,其實(shí)按理...
    jane_yin閱讀 381評(píng)論 0 1
  • 親愛(ài)的???患者,恭喜你亥宿,你已經(jīng)踏出了正畸漫漫征途的第一步卸勺,我們共同為你的美好微笑努力!(矯正的第一個(gè)月是最辛苦的...
    周欣榮閱讀 2,388評(píng)論 0 0
  • -文/劉婧 正巧烫扼,流浪漢又碰到了時(shí)光老人曙求。 “求求你了,求求你再給我一次機(jī)會(huì)吧映企!我定不會(huì)重蹈覆轍了悟狱!求求你了……”...
    劉婧_閱讀 3,301評(píng)論 2 6