2020-09-27 神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)預(yù)處理

關(guān)于數(shù)據(jù)預(yù)處理我們有3個常用的符號,數(shù)據(jù)矩陣X吗浩,假設(shè)其尺寸是[N x D](N是數(shù)據(jù)樣本的數(shù)量,D是數(shù)據(jù)的維度)

1、均值減法(Mean subtraction)

均值減法是預(yù)處理最常用的形式泉褐。它對數(shù)據(jù)中每個獨立特征減去平均值,從幾何上可以理解為在每個維度上都將數(shù)據(jù)云的中心都遷移到原點鸟蜡。
在numpy中膜赃,該操作可以通過代碼X -= np.mean(X, axis=0)實現(xiàn)。
而對于圖像揉忘,更常用的是對所有像素都減去一個值跳座,可以用X -= np.mean(X)實現(xiàn),也可以在3個顏色通道上分別操作泣矛。

歸一化(Normalization)

歸一化是指將數(shù)據(jù)的所有維度都?xì)w一化疲眷,使其數(shù)值范圍都近似相等。

有兩種常用方法可以實現(xiàn)歸一化:

第一種是先對數(shù)據(jù)做零中心化(zero-centered)處理您朽,然后每個維度都除以其標(biāo)準(zhǔn)差狂丝,實現(xiàn)代碼為X /= np.std(X, axis=0)。
第二種方法是對每個維度都做歸一化哗总,使得每個維度的最大和最小值是1和-1几颜。這個預(yù)處理操作只有在確信不同的輸入特征有不同的數(shù)值范圍(或計量單位)時才有意義,但要注意預(yù)處理操作的重要性幾乎等同于學(xué)習(xí)算法本身讯屈。在圖像處理中蛋哭,由于像素的數(shù)值范圍幾乎是一致的(都在0-255之間),所以進行這個額外的預(yù)處理步驟并不是很必要涮母。

PCA和白化(Whitening)

PCA和白化是另一種預(yù)處理形式谆趾。在這種處理中,先對數(shù)據(jù)進行零中心化處理叛本,然后計算協(xié)方差矩陣棺妓,它展示了數(shù)據(jù)中的相關(guān)性結(jié)構(gòu)。

白化(whitening)炮赦。白化操作的輸入是特征基準(zhǔn)上的數(shù)據(jù)怜跑,然后對每個維度除以其特征值來對數(shù)值范圍進行歸一化。該變換的幾何解釋是:如果數(shù)據(jù)服從多變量的高斯分布吠勘,那么經(jīng)過白化后性芬,數(shù)據(jù)的分布將會是一個均值為零,且協(xié)方差相等的矩陣剧防。該操作的代碼如下:

# 對數(shù)據(jù)進行白化操作:
# 除以特征值 
Xwhite = Xrot / np.sqrt(S + 1e-5)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末植锉,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子峭拘,更是在濱河造成了極大的恐慌俊庇,老刑警劉巖狮暑,帶你破解...
    沈念sama閱讀 219,589評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異辉饱,居然都是意外死亡搬男,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,615評論 3 396
  • 文/潘曉璐 我一進店門彭沼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缔逛,“玉大人,你說我怎么就攤上這事姓惑『峙” “怎么了?”我有些...
    開封第一講書人閱讀 165,933評論 0 356
  • 文/不壞的土叔 我叫張陵于毙,是天一觀的道長敦冬。 經(jīng)常有香客問我,道長唯沮,這世上最難降的妖魔是什么脖旱? 我笑而不...
    開封第一講書人閱讀 58,976評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮烂翰,結(jié)果婚禮上夯缺,老公的妹妹穿的比我還像新娘。我一直安慰自己甘耿,他們只是感情好踊兜,可當(dāng)我...
    茶點故事閱讀 67,999評論 6 393
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著佳恬,像睡著了一般捏境。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上毁葱,一...
    開封第一講書人閱讀 51,775評論 1 307
  • 那天垫言,我揣著相機與錄音,去河邊找鬼倾剿。 笑死筷频,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的前痘。 我是一名探鬼主播凛捏,決...
    沈念sama閱讀 40,474評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼芹缔!你這毒婦竟也來了坯癣?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,359評論 0 276
  • 序言:老撾萬榮一對情侶失蹤最欠,失蹤者是張志新(化名)和其女友劉穎示罗,沒想到半個月后惩猫,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,854評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡蚜点,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,007評論 3 338
  • 正文 我和宋清朗相戀三年轧房,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片禽额。...
    茶點故事閱讀 40,146評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡锯厢,死狀恐怖皮官,靈堂內(nèi)的尸體忽然破棺而出脯倒,到底是詐尸還是另有隱情,我是刑警寧澤捺氢,帶...
    沈念sama閱讀 35,826評論 5 346
  • 正文 年R本政府宣布藻丢,位于F島的核電站,受9級特大地震影響摄乒,放射性物質(zhì)發(fā)生泄漏悠反。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,484評論 3 331
  • 文/蒙蒙 一馍佑、第九天 我趴在偏房一處隱蔽的房頂上張望斋否。 院中可真熱鬧,春花似錦拭荤、人聲如沸茵臭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,029評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽旦委。三九已至,卻和暖如春雏亚,著一層夾襖步出監(jiān)牢的瞬間缨硝,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,153評論 1 272
  • 我被黑心中介騙來泰國打工罢低, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留查辩,地道東北人。 一個月前我還...
    沈念sama閱讀 48,420評論 3 373
  • 正文 我出身青樓网持,卻偏偏與公主長得像宜岛,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子翎碑,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,107評論 2 356