關(guān)于對(duì)數(shù)的一些小知識(shí):
這一篇是關(guān)于對(duì)數(shù)變換的
在對(duì)數(shù)據(jù)進(jìn)行處理,或者進(jìn)行可視化的時(shí)候穗泵,經(jīng)常要對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,有時(shí)候就會(huì)用到對(duì)數(shù)變換现诀。
在網(wǎng)上整理了一些資料履肃,如下。
對(duì)數(shù)變換(log transformation)尺棋,是特殊的一種數(shù)據(jù)變換方式,它可以將一類我們理論上未解決的問(wèn)題轉(zhuǎn)換為已經(jīng)解決的問(wèn)題成福。
數(shù)據(jù)變換的目的荆残,是能夠讓它符合我們的假設(shè),是我們能夠在已有理論上對(duì)其進(jìn)行分析内斯。
為什么要做數(shù)據(jù)變換
在上一篇中 對(duì)數(shù)坐標(biāo)軸像啼,其實(shí)又說(shuō)到品擎,類似的情況
數(shù)據(jù)變換,是為了更便捷的發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系(更好的數(shù)據(jù)可視化)
比如甚颂,對(duì)兩個(gè)指標(biāo)做散點(diǎn)圖:
會(huì)發(fā)現(xiàn)秀菱,橫坐標(biāo)的數(shù)據(jù)差異較大,且集中在較小值的一端衍菱,我們就可以對(duì)橫坐標(biāo)取個(gè)對(duì)數(shù)
數(shù)據(jù)就很分散了
為什么可以做數(shù)據(jù)變換
這也是我一開始很困惑的地方脊串,現(xiàn)在其實(shí)也沒(méi)有很好地理解,只是知道可以這樣做
找到的資料中琼锋,有對(duì)數(shù)據(jù)進(jìn)行驗(yàn)證的
很多都提到了異方差,數(shù)據(jù)分布等等怖侦,經(jīng)濟(jì)學(xué)上的很多模型也都是這樣處理的
特征工程
有資料說(shuō)谜叹,數(shù)據(jù)變換,是特征工程的一種技巧荷腊,用來(lái)減輕數(shù)據(jù)分布傾斜的影響,使原本密集的區(qū)間的值很钓,盡可能的分散董栽。
對(duì)數(shù)變換码倦,主要作用在于幫助穩(wěn)定方差锭碳,始終保持分布接近于正態(tài)分布
有偏數(shù)據(jù),經(jīng)過(guò)對(duì)數(shù)變換:
附錄
參考了幾篇知乎的回答: