本期解答人:中關(guān)村大街
異質(zhì)性和異方差都帶一個“異”字熊杨,英文前綴也相同——異質(zhì)性是Heterogeneity十籍,異方差是 Heteroskedasticity,但其含義有很大不同。一些朋友易將兩者混淆矾睦,筆者嘗試用比較直觀(因此可能不夠嚴(yán)謹(jǐn))的方法進(jìn)行區(qū)分。
一個變量X對另一個變量Y的影響可能因人而異炎功。例如枚冗,多上一年學(xué)讓張三的收入增加了1000元,讓李四的收入增加了1200元蛇损,那么教育年限對收入的影響就存在異質(zhì)性赁温。與異質(zhì)性相對的是同質(zhì)性。如果多上一年學(xué)使所有人的收入都增加1000元淤齐,那么教育年限對收入的影響就是同質(zhì)的股囊。
在變量X的不同水平上,變量Y取值的波動大小可能不同更啄。例如稚疹,在所有小學(xué)畢業(yè)(上過六年學(xué))的人里面,有的做了老板祭务,年入百萬贫堰,有的成為工薪階層,年入幾萬——在六年教育水平上待牵,收入取值的波動很大。在所有大學(xué)畢業(yè)(上過十六年學(xué))的人里面喇勋,大家都能找到不錯的工作缨该,收入多的年賺百萬,收入低的也有幾十萬——在十六年的教育水平上川背,收入取值的波動較小贰拿。在這個例子中,收入(Y)的波動大小會隨著教育水平(X)的變化而變化熄云,因此Y相對于X有異方差膨更。與異方差相對的是同方差,也即變量Y的取值波動不隨自變量X的變化而變化缴允。例如荚守,小學(xué)畢業(yè)的人的收入水平大都比較低,大學(xué)畢業(yè)的人的收入水平大都比較高练般,但是小學(xué)畢業(yè)的所有人的收入波動大小與大學(xué)畢業(yè)的所有人的收入波動大小可能差不多矗漾。
異(同)質(zhì)性與異(同)方差之間有怎樣的關(guān)系呢?如果Y相對于X是同方差薄料,那么X對Y的影響可能是同質(zhì)的敞贡,也可能是異質(zhì)的。簡便起見摄职,我們看一個極端的例子誊役。假如所有上過六年學(xué)的人的年收入都是1萬元获列,所有上過七年學(xué)的人的年收入都是1.2萬元,所有上過八年學(xué)的人的年收入都是1.4萬元蛔垢。那么击孩,收入(Y)相對于教育年限(X)是同方差的——不管教育水平是多少,收入在同一教育水平內(nèi)的波動大小都是0啦桌。那么教育年限對收入的影響呢溯壶?六年教育水平的人多上一年學(xué),年收入從1萬元變成1.2萬元甫男,漲了兩千元且改;七年教育水平的人多上一年學(xué),年收入從1.2萬元變成1.4萬元板驳,也漲了兩千元又跛。換句話說,不管是誰若治,多上一年學(xué)帶來的收入增長都是兩千元——教育年限對收入水平的影響是同質(zhì)的慨蓝。但如果稍微改一下例子,令所有上過八年學(xué)的人的年收入都是1.6萬元端幼,那么收入相對于教育年限仍是同方差的(方差是0)礼烈,但教育年限對收入的影響則存在異質(zhì)性了。六年教育水平的人多上一年學(xué)婆跑,年收入仍然增加兩千元此熬;但七年教育水平的人多上一年學(xué),年收入增加四千元(從1.2萬元到1.6萬元)滑进。換句話說犀忱,教育年限對收入的影響在上過六年學(xué)和上過七年學(xué)的這兩類群體中是不同的,存在異質(zhì)性扶关。
如果Y相對于X有異方差阴汇,那么一般來說,X對Y的影響是異質(zhì)的节槐。再來看一個簡化的例子搀庶。假如所有上過六年學(xué)的人的年收入都是1萬元;在上過七年學(xué)的人里面铜异,一部分人(比如女性)的收入是1.1萬元地来,另一部分人(比如男性)的收入是1.2萬元。那么收入相對于教育年限是異方差的——在六年教育水平上熙掺,收入波動是0未斑;但在七年教育水平上,收入存在波動币绩。如果上過六年學(xué)的人再上一年學(xué)蜡秽,收入可能漲一千元(對于女性府阀,從1萬元到1.1萬元),也可能漲兩千元(對于男性芽突,從1萬元到1.2萬元)试浙。因此,教育年限對收入的影響可能因人而異(在上述例子中是因性別而異)寞蚌,存在異質(zhì)性田巴。