因?yàn)?018年的子女最高學(xué)歷變量有很多缺失值赢赊,查看了問卷之后發(fā)現(xiàn)是因?yàn)橛殖霈F(xiàn)了預(yù)先儲(chǔ)存好的變量,很大可能是因?yàn)樯弦淮握{(diào)查中已經(jīng)記錄了該變量的內(nèi)容释移,所以就到2015年的數(shù)據(jù)中去找寥殖,確實(shí)2015年中的缺失值只有很少一部分,于是對(duì)最高學(xué)歷這個(gè)變量進(jìn)行處理熏纯,刪除了所有孩子的最高學(xué)歷都小于7的樣本豆巨,剩下了4204個(gè)樣本。
沒有刪除子女最高學(xué)歷缺失值的情況下跑基本回歸:
然后試了試把最高學(xué)歷為中專的設(shè)為1,其余設(shè)為0萍膛,不顯著蝗罗。然后把缺失值也設(shè)為0,直接不出結(jié)果了沼琉。
然后試了試把最高學(xué)歷小于7的刪掉打瘪,再把最高學(xué)歷大于7的設(shè)為0(保留缺失值):
然后再把最高學(xué)歷為中專的設(shè)為1闺骚,再跑了一遍模型僻爽,發(fā)現(xiàn)沒有變化:
下次可以先試試其他幾個(gè)孩子胸梆,不過大概率也不行乳绕。還可以通過疊加14年洋措、15年的數(shù)據(jù)來增加樣本量杰刽,切記疊加之前要先給現(xiàn)在的數(shù)據(jù)加時(shí)間變量。