深度學(xué)習(xí)中 Embedding層兩大作用的個人理解

轉(zhuǎn)載:深度學(xué)習(xí)中 Embedding層兩大作用的個人理解

前一個月接觸到一個概念宅楞,Embedding層慕匠。今天跟大家分享一下個人心得煮剧。


首先鹦赎,我們有一個one-hot編碼的概念傍菇。


假設(shè)猾瘸,我們中文,一共只有10個字。牵触。淮悼。只是假設(shè)啊,那么我們用0-9就可以表示完

比如揽思,這十個字就是“我從哪里來袜腥,要到何處去”

其分別對應(yīng)“0-9”,如下:

我? 從? 哪? 里? 來? 要? 到? 何? 處? 去

0??? 1??? 2??? 3?? 4??? 5?? 6??? 7??? 8 ? 9

那么钉汗,其實我們只用一個列表就能表示所有的對話

如:我? 從? 哪? 里? 來? 要? 到? 何? 處? 去? ——>>>[0 1 2 3 4 5 6 7 8 9]

或:我? 從? 何? 處? 來? 要? 到? 哪? 里? 去? ——>>>[0 1 7 8 4 5 6 2 3 9]


但是羹令,我們看看one-hot編碼方式(詳見:https://blog.csdn.net/tengyuan93/article/details/78930285)

他把上面的編碼方式弄成這樣

# 我從哪里來,要到何處去

[

[1 0 0 0 0 0 0 0 0 0]

[0 1 0 0 0 0 0 0 0 0]

[0 0 1 0 0 0 0 0 0 0]

[0 0 0 1 0 0 0 0 0 0]

[0 0 0 0 1 0 0 0 0 0]

[0 0 0 0 0 1 0 0 0 0]

[0 0 0 0 0 0 1 0 0 0]

[0 0 0 0 0 0 0 1 0 0]

[0 0 0 0 0 0 0 0 1 0]

[0 0 0 0 0 0 0 0 0 1]

]

# 我從何處來损痰,要到哪里去

[

[1 0 0 0 0 0 0 0 0 0]

[0 1 0 0 0 0 0 0 0 0]

[0 0 0 0 0 0 0 1 0 0]

[0 0 0 0 0 0 0 0 1 0]

[0 0 0 0 1 0 0 0 0 0]

[0 0 0 0 0 1 0 0 0 0]

[0 0 0 0 0 0 1 0 0 0]

[0 0 1 0 0 0 0 0 0 0]

[0 0 0 1 0 0 0 0 0 0]

[0 0 0 0 0 0 0 0 0 1]

]

即:把每一個字都對應(yīng)成一個十個(樣本總數(shù)/字總數(shù))元素的數(shù)組/列表福侈,其中每一個字都用唯一對應(yīng)的數(shù)組/列表對應(yīng),數(shù)組/列表的唯一性用1表示卢未。如上肪凛,“我”表示成[1。辽社。伟墙。。]爹袁,“去”表示成[远荠。。失息。譬淳。1],這樣就把每一系列的文本整合成一個稀疏矩陣盹兢。


那問題來了,稀疏矩陣(二維)和列表(一維)相比绎秒,有什么優(yōu)勢浦妄。

很明顯,計算簡單嘛见芹,稀疏矩陣做矩陣計算的時候剂娄,只需要把1對應(yīng)位置的數(shù)相乘求和就行,也許你心算都能算出來玄呛;而一維列表阅懦,你能很快算出來?何況這個列表還是一行徘铝,如果是100行耳胎、1000行和或1000列呢惯吕?

所以,one-hot編碼的優(yōu)勢就體現(xiàn)出來了怕午,計算方便快捷废登、表達(dá)能力強(qiáng)。

然而郁惜,缺點也隨著來了堡距。

比如:中文大大小小簡體繁體常用不常用有十幾萬,然后一篇文章100W字扳炬,你要表示成100W X 10W的矩陣吏颖?搔体?恨樟?

這是它最明顯的缺點。過于稀疏時疚俱,過度占用資源劝术。

比如:其實我們這篇文章,雖然100W字呆奕,但是其實我們整合起來养晋,有99W字是重復(fù)的,只有1W字是完全不重復(fù)的梁钾。那我們用100W X 10W的豈不是白白浪費了99W X 10W的矩陣存儲空間绳泉。

那怎么辦?姆泻?零酪?

這時,Embedding層橫空出世拇勃。


插張圖片休息下四苇。

OK, keep going方咆!

接下來給大家看一張圖


鏈接:https://spaces.ac.cn/archives/4122

假設(shè):我們有一個2 x 6的矩陣月腋,然后乘上一個6 x 3的矩陣后,變成了一個2 x 3的矩陣瓣赂。

先不管它什么意思胎源,這個過程,我們把一個12個元素的矩陣變成6個元素的矩陣流译,直觀上宛裕,大小是不是縮小了一半?

也許你已經(jīng)想到了Q揽薄V翱摇所禀!對!7徘铡色徘!不管你想的對不對,但是embedding層操禀,在某種程度上褂策,就是用來降維的,降維的原理就是矩陣乘法颓屑。在卷積網(wǎng)絡(luò)中斤寂,可以理解為特殊全連接層操作,跟1x1卷積核異曲同工>镜搿1楦恪!484很神奇F饕浮O场!


復(fù)習(xí)一下纫塌,矩陣乘法需要滿足一個條件诊县。

A X B時,B的行數(shù)必須等于A的列數(shù)

得出的結(jié)果為A的行數(shù) X B的列數(shù)的一個矩陣

也就是說措左,假如我們有一個100W X10W的矩陣依痊,用它乘上一個10W X 20的矩陣,我們可以把它降到100W X 20怎披,瞬間量級降了胸嘁。。钳枕。10W/20=5000倍=稍ā!鱼炒!

這就是嵌入層的一個作用——降維衔沼。

然后中間那個10W X 20的矩陣,可以理解為查詢表昔瞧,也可以理解為映射表指蚁,也可以理解為過度表,whatever自晰。

--------

--------

--------

接著凝化,既然可以降維,當(dāng)然也可以升維酬荞。為什么要升維搓劫?

這也是很神奇的瞧哟。咱們再舉一個例子:

這張圖,我要你在10米開外找出五處不同枪向!勤揩。。秘蛔。What陨亡?煩請出題者走近兩步,我先把我的刀拿出來深员,您再說一遍題目我沒聽清负蠕。

當(dāng)然,目測這是不可能完成的倦畅。但是我讓你在一米外遮糖,也許你一瞬間就發(fā)現(xiàn)衣服上有個心是不同的,然后再走近半米滔迈,你又發(fā)現(xiàn)左上角和右上角也是不同的止吁。再走近20厘米被辑,又發(fā)現(xiàn)耳朵也不同燎悍,最后,在距離屏幕10厘米的地方盼理,終于發(fā)現(xiàn)第五個不同的地方在耳朵下面一點的云谈山。

但是,其實無限靠近并不代表認(rèn)知度就高了宏怔,比如奏路,你只能距離屏幕1厘米遠(yuǎn)的地方找,找出五處不同臊诊。鸽粉。。出題人你是不是腦袋被門擠了抓艳。触机。。

由此可見玷或,距離的遠(yuǎn)近會影響我們的觀察效果儡首。同理也是一樣的,低維的數(shù)據(jù)可能包含的特征是非称眩籠統(tǒng)的蔬胯,我們需要不停地拉近拉遠(yuǎn)來改變我們的感受野,讓我們對這幅圖有不同的觀察點位他,找出我們要的茬氛濒。

embedding的又一個作用體現(xiàn)了产场。對低維的數(shù)據(jù)進(jìn)行升維時,可能把一些其他特征給放大了舞竿,或者把籠統(tǒng)的特征給分開了涝动。同時,這個embedding是一直在學(xué)習(xí)在優(yōu)化的炬灭,就使得整個拉近拉遠(yuǎn)的過程慢慢形成一個良好的觀察點醋粟。比如:我來回靠近和遠(yuǎn)離屏幕,發(fā)現(xiàn)45厘米是最佳觀測點重归,這個距離能10秒就把5個不同點找出來了米愿。


回想一下為什么CNN層數(shù)越深準(zhǔn)確率越高,卷積層卷了又卷鼻吮,池化層池了又升育苟,升了又降,全連接層連了又連椎木。因為我們也不知道它什么時候突然就學(xué)到了某個有用特征违柏。但是不管怎樣,學(xué)習(xí)都是好事香椎,所以讓機(jī)器多卷一卷漱竖,多連一連,反正錯了多少我會用交叉熵告訴你畜伐,怎么做才是對的我會用梯度下降算法告訴你馍惹,只要給你時間,你遲早會學(xué)懂玛界。因此万矾,理論上,只要層數(shù)深慎框,只要參數(shù)足夠良狈,NN能擬合任何特征。


總之笨枯,它類似于虛擬出一個關(guān)系對當(dāng)前數(shù)據(jù)進(jìn)行映射薪丁。這個東西也許一言難盡吧,但是目前各位只需要知道它有這些功能的就行了猎醇。

想具體理解其作用窥突,建議大家去探究探究卷積神經(jīng)網(wǎng)絡(luò)的各種中間過程,以及反向傳播理論硫嘶。到時候大家再來深入理解嵌入層時阻问,那就一通百通了。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末沦疾,一起剝皮案震驚了整個濱河市称近,隨后出現(xiàn)的幾起案子第队,更是在濱河造成了極大的恐慌,老刑警劉巖刨秆,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件凳谦,死亡現(xiàn)場離奇詭異,居然都是意外死亡衡未,警方通過查閱死者的電腦和手機(jī)尸执,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缓醋,“玉大人如失,你說我怎么就攤上這事∷土唬” “怎么了褪贵?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長抗俄。 經(jīng)常有香客問我脆丁,道長,這世上最難降的妖魔是什么动雹? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任槽卫,我火速辦了婚禮,結(jié)果婚禮上洽胶,老公的妹妹穿的比我還像新娘晒夹。我一直安慰自己,他們只是感情好姊氓,可當(dāng)我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著喷好,像睡著了一般翔横。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上梗搅,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天禾唁,我揣著相機(jī)與錄音,去河邊找鬼无切。 笑死荡短,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的哆键。 我是一名探鬼主播掘托,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼籍嘹!你這毒婦竟也來了闪盔?” 一聲冷哼從身側(cè)響起弯院,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎泪掀,沒想到半個月后听绳,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡异赫,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年椅挣,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片塔拳。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡贴妻,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出蝙斜,到底是詐尸還是另有隱情名惩,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布孕荠,位于F島的核電站娩鹉,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏稚伍。R本人自食惡果不足惜弯予,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望个曙。 院中可真熱鬧锈嫩,春花似錦、人聲如沸垦搬。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽猴贰。三九已至对雪,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間米绕,已是汗流浹背瑟捣。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留栅干,地道東北人迈套。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像碱鳞,于是被迫代替她去往敵國和親桑李。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容