1、標(biāo)識(shí)重復(fù)個(gè)案
1)“定義匹配個(gè)案依據(jù)”
用于確認(rèn)重復(fù)個(gè)案的變量列表腺律,可能是一個(gè)或多個(gè)變量組合奕短。如果某個(gè)個(gè)案的所有這些變量值與另一個(gè)個(gè)案都相同,則視為重復(fù)個(gè)案匀钧。
2)在匹配組內(nèi)的重復(fù)標(biāo)準(zhǔn)
對(duì)于重復(fù)的個(gè)案翎碑,按照所選變量進(jìn)行升序或降序排列,變量列表的順序很重要之斯,即重復(fù)的個(gè)案先按照第一個(gè)個(gè)案標(biāo)準(zhǔn)排序日杈,如果仍然相同,再按第二個(gè)變量標(biāo)準(zhǔn)排序佑刷,每個(gè)變量都可以分別設(shè)置不同的升序或降序莉擒。
3)“基本個(gè)案指示符”
對(duì)于重復(fù)個(gè)案,指定其中一個(gè)為主個(gè)案项乒,其余的為重復(fù)個(gè)案啰劲,可以講第一個(gè)或最后一個(gè)個(gè)案設(shè)為主個(gè)案,主個(gè)案取值為1檀何,重復(fù)的個(gè)案取值為0
4)連續(xù)計(jì)算每個(gè)組合中的匹配個(gè)案
在每一個(gè)匹配組合中為個(gè)案創(chuàng)建序列值為1到n的變量蝇裤。序列值基于每一組中當(dāng)前個(gè)案的順序,也就是原文件順序频鉴,也可以是任何指定的排序變量決定的順序栓辜。
實(shí)例:以ID為標(biāo)準(zhǔn),將重復(fù)個(gè)案按分析升序垛孔、年齡降序排列藕甩。
具體分析步驟拆解:
輸出結(jié)果如下:
結(jié)果解讀:
紅色框標(biāo)識(shí)ID為5的有3個(gè)重復(fù),以最后一個(gè)個(gè)案為主個(gè)案周荐,按分?jǐn)?shù)升序排列狭莱,且生成了連續(xù)計(jì)數(shù)變量“匹配順序”
藍(lán)色框同理
2僵娃、標(biāo)識(shí)異常個(gè)案
暫不介紹,對(duì)初學(xué)者不太適用