眾所周知, 我有很多醫(yī)生朋友. 他們經(jīng)常需要做一些敏感問(wèn)題的調(diào)查, 比如"你是否有婚外情"或者"你是否是個(gè)彎彎". 不要問(wèn)為什么, 問(wèn)就是為了寫論文.
這些敏感問(wèn)題的肯定回答會(huì)讓被調(diào)查者非常難堪, 從而導(dǎo)致他們拒絕或者不誠(chéng)實(shí)地回答問(wèn)題. 事實(shí)上, 在發(fā)出問(wèn)卷調(diào)查時(shí), 我的醫(yī)生朋友非常擔(dān)心被打爆狗頭.
隨機(jī)化回答技術(shù)
在跟我學(xué)過(guò)統(tǒng)計(jì)學(xué)的老婆聊這個(gè)問(wèn)題的時(shí)候, 她說(shuō)可以用采用隨機(jī)化回答技術(shù)解決這個(gè)問(wèn)題.
所謂的隨機(jī)化回答技術(shù), 就是指在調(diào)查中使用特定的隨機(jī)裝置, 使調(diào)查者以預(yù)定的概率回答問(wèn)題. 這一技術(shù)可以最大限度的保護(hù)被調(diào)查者的隱私, 從而取得被調(diào)查者的信任. 舉個(gè)簡(jiǎn)單的例子, 比如調(diào)查某地婚外情的比例時(shí), 可以給被調(diào)查者一個(gè)硬幣, 讓他避開(kāi)調(diào)查人員自己拋硬幣, 正面向上則回答問(wèn)題"你是否有過(guò)婚外情莺掠?", 反面向上則回答"你的生日是否在 7 月 1 日以前?". 因?yàn)檎{(diào)查人員不知道回答的是哪個(gè)問(wèn)題, 所以可以更容易的取得被調(diào)查者的信任.
我們這里主要介紹兩種最簡(jiǎn)單的隨機(jī)化回答技術(shù), 即沃納模型和西蒙斯模型.
沃納模型
沃納模型是由 Warner 在 1965 年提出的, 該模型向被調(diào)查者提問(wèn)兩個(gè)與敏感性特征相關(guān)但結(jié)果完全相反的問(wèn)題. 假定我們想調(diào)查"有過(guò)婚外情行為"的人所占的比例 , 則可以設(shè)計(jì)下面兩個(gè)問(wèn)題:
- 問(wèn)題1:你是否有過(guò)婚外情行為.
- 問(wèn)題2:你是否從沒(méi)有過(guò)婚外情行為.
同時(shí), 調(diào)查者準(zhǔn)備一副牌作為隨機(jī)裝置, 這副牌中中有比例 的牌標(biāo)有數(shù)字 , 其余比例為 的牌標(biāo)有數(shù)字 , 除此以外, 牌沒(méi)有其它的區(qū)別. 對(duì) 個(gè)被調(diào)查者中的每一個(gè)人重復(fù)以下過(guò)程: 被調(diào)查者從洗好的整副牌中隨便地選取一張, 記下牌上的數(shù)字, 數(shù)字不要讓調(diào)查人員者看見(jiàn). 如果被調(diào)查者抽到的牌標(biāo)有數(shù)字 , 他用"是"或"不是"回答問(wèn)題 1;如果抽到的牌標(biāo)有數(shù)字 , 則回答問(wèn)題 2. 調(diào)查者只能獲得"是"和"不是"的答案, 并不知道被調(diào)查者回答的是哪個(gè)問(wèn)題. 然而, 即使只知道"是"的回答數(shù), 調(diào)查人員也能估計(jì)出來(lái). 為了方便, 我們引進(jìn)下面的記號(hào):
用全概率公式, 我們可以寫出訪問(wèn)者得到回答"是"的概率:
使用用表格里的記號(hào), 可以得到等式:
假設(shè)總共有個(gè)人回答"是", 并用近似, 可以很容易地得到的估計(jì)值
西蒙斯模型
在沃納模型中, 兩個(gè)問(wèn)題都涉及到了敏感問(wèn)題, 仍然可能會(huì)引起人們的戒備. Simmons
改進(jìn)了沃納模型, 提出了西蒙斯模型(也被稱為不相關(guān)問(wèn)題模型). 該模型的基本思想是:向被調(diào)查者提出一個(gè)無(wú)關(guān)緊要的問(wèn)題, 被調(diào)查者可能在感情上會(huì)覺(jué)得更安全, 因?yàn)樽鞒龌卮饡r(shí)不能向訪問(wèn)者泄漏更多的信息. 即在"匿名狀態(tài)"的情況下, 使用兩個(gè)互不相關(guān)的問(wèn)題, 一個(gè)與敏感問(wèn)題相關(guān), 另一個(gè)是非敏感問(wèn)題, 調(diào)查人員會(huì)得到更多的信任. 在西蒙斯模型中, 被調(diào)查者隨機(jī)地選取下列問(wèn)題中的一個(gè)回答:
- 問(wèn)題 1:你是否有過(guò)婚外情行為读宙?
- 問(wèn)題 2:你的生日是在7月1日以前嗎汁蝶?
其中問(wèn)題 2 也可以換為其它非敏感問(wèn)題, 只要概率 是已知的即可, 比如
- 問(wèn)題 2a:你是8月份出生的么?
- 問(wèn)題 2b:你的身份證最后一位是奇數(shù)么论悴?
與沃納模型一樣, 調(diào)查者需要準(zhǔn)備一隨機(jī)裝置, 每個(gè)調(diào)查者都根據(jù)隨機(jī)試驗(yàn)的結(jié)果回答相應(yīng)的問(wèn)題. 調(diào)查者僅能得到"是"與"不是"的答案, 但卻能夠用這些數(shù)據(jù)估計(jì)出來(lái).
為了說(shuō)明這一點(diǎn), 我們引入下列符號(hào):
根據(jù)全概率公式, 我們可以得到:
使用表格里的符號(hào)掖棉,可以得到等式:
假設(shè)總共有個(gè)人回答結(jié)果為"是", 并用近似, 就可以得到的估計(jì)值
隨機(jī)化回答法技術(shù)的使用
抽樣調(diào)查的策劃工作包括一些不同的環(huán)節(jié). 這些環(huán)節(jié)包括調(diào)查的準(zhǔn)備、調(diào)查的實(shí)施膀估、數(shù)據(jù)收集和最后的解釋數(shù)據(jù). 除了問(wèn)題的設(shè)計(jì)之外, 耐心地給被調(diào)查者解釋也是至關(guān)重要的. 被調(diào)查者了解無(wú)人知道他回答的哪個(gè)問(wèn)題后, 對(duì)敏感性調(diào)查的抵觸會(huì)更低.
此外, 隨機(jī)裝置應(yīng)盡可能簡(jiǎn)單. 在試驗(yàn)開(kāi)始前應(yīng)允許被問(wèn)者檢查該裝置. 檢查具有雙重目的:一是使被問(wèn)者相信裝置里沒(méi)有做手腳, 二是使被問(wèn)者明白怎樣使用該裝置.
歡迎關(guān)注公眾號(hào):數(shù)學(xué)知識(shí)派