SPSS數據文件的合并方式有兩種:縱向拼接和橫向合并。
縱向拼接:指的是幾個數據集中的數據縱向相連蜈垮,組成一個新的數據集,新的數據集中的記錄數是原來幾個數據集中記錄數的總和。其實質就是將兩個數據文件的變量列按照各個變量的含義一一對應進行首尾連接掏湾。
橫向合并:值得是按照記錄的次序裹虫,或者某個關鍵變量的數值,將不同數據集中的不同變量拼接為一個數據集忘巧,新數據及中的變量書是雖有數據集中不重復變量名的總和恒界。橫向合并的實質就是將兩個數據文件的記錄按照對應關系一一進行左右對接。
縱向拼接實例:將文件b拼接到文件a
【數據】--【合并文件】--【添加個案】
1)非成對變量
是指兩個文件中不一樣的變量砚嘴,無法自動匹配
如本例中“用戶編碼十酣、sex、age”變量名相同际长,是可以自動匹配的耸采,但是“Height、H工育、W ”無法自動匹配虾宇,雖然H和Height是同一個意思,但是因為變量名不同如绸,不能自動識別嘱朽,我們可以強制讓H和Height相同。
方法如下:
選中H和Height怔接,點擊【配對】按鈕搪泳,強制定義H和Height含義相同。
但是對于W變量扼脐,由于文件a中沒有可與之匹配的變量岸军,可以不選,也可以選擇生成到新的數據表中瓦侮。
“只是個案源變量”
勾選后會標識每個個案的來源艰赞,也就是說是來自文件a還是文件b,1標識來源于源文件a肚吏,0標識來源于拼接文件b
拼接之后的結果如下:
橫向連接遵循是三個條件:
1方妖、兩個文件必須至少有一個變量名相同的關鍵變量,該關鍵變量是數據文件橫向連接的依據罚攀,比如學號党觅,id等,關鍵變量可以使多個坞生,并且關鍵變量的取值在不同的個案間最好有唯一性仔役。
2、如果是使用關鍵變量進行合并是己,那么必須事先把兩個文件的關鍵變量按照升序進行排列又兵,否則系統(tǒng)將會報錯。
3、數據含義不同時沛厨,盡量不要用相同的變量名宙地。
實例:將文件c橫向連接到文件a
【數據】--【文件合并】--【添加變量】