模型壓縮

這篇文章主要是根據(jù)李宏毅老師介紹的知識(shí)要點(diǎn)進(jìn)行總結(jié)
【機(jī)器學(xué)習(xí)2021】神經(jīng)網(wǎng)路壓縮 (Network Compression) (一) - 類(lèi)神經(jīng)網(wǎng)路剪枝 (Pruning) 與大樂(lè)透假說(shuō) (Lottery Ticket Hypothesis)

【機(jī)器學(xué)習(xí)2021】神經(jīng)網(wǎng)路壓縮 (Network Compression) (二) - 從各種不同的面向來(lái)壓縮神經(jīng)網(wǎng)路
由于很多模型需要移植到硬件設(shè)備上晌块,以及對(duì)模型運(yùn)行效率有比較高的要求堡距,所以我們需要對(duì)我們的模型進(jìn)行剪枝以及壓縮等操作请契。 以下將通過(guò)5個(gè)方面講解模型壓縮知識(shí):

  • Network Pruning(剪枝)
  • Knowledge Distillation(蒸餾)
  • Parameter Quantization(量化)
  • Architecture Design(結(jié)構(gòu)設(shè)計(jì))
  • Dynamic Computation (動(dòng)態(tài)計(jì)算)

一、Network Purning(剪枝)



通過(guò)上圖可以看出隨著人類(lèi)成長(zhǎng) 步鉴,經(jīng)過(guò)剪枝,我們的神經(jīng)元連接是越來(lái)越少。我們?nèi)绾螌?duì)我們的參數(shù)進(jìn)行剪枝呢蓝丙?我們需要剪枝哪些參數(shù)呢磨淌?

  • 參數(shù) 顯而易見(jiàn)的我們可以理解為當(dāng)我們的參數(shù)(權(quán)重)的絕對(duì)值越大疲憋,我們認(rèn)為該參數(shù)(權(quán)重)對(duì)模型影響越重要。
  • 神經(jīng)元 當(dāng)然我們也可以根據(jù)神經(jīng)元不為0的次數(shù)判斷其重要性

最終我們的希望的是通過(guò)剪枝我們的模型的準(zhǔn)確率不會(huì)下降太大梁只。剪枝完之后缚柳,我們?cè)偌糁蟮哪P瓦M(jìn)行finetune埃脏,接著在評(píng)價(jià)參數(shù)重要性進(jìn)行剪枝,可以進(jìn)行多輪秋忙,但是切記我們剪枝不要剪枝過(guò)多彩掐,否則網(wǎng)絡(luò)很難還原。

weight purning

在進(jìn)行權(quán)重剪枝的時(shí)候灰追,我們很難將權(quán)重直接干掉如上圖所示堵幽,這樣不僅很難部署,同時(shí)也很難做到GPU加速弹澎。

neuron pruning

在進(jìn)行神經(jīng)元剪枝的時(shí)候朴下,我們可以很容易的進(jìn)行部署及GPU加速。



為什么要從大的網(wǎng)絡(luò)開(kāi)始訓(xùn)練然后再剪枝呢苦蒿?因?yàn)樾〉纳窠?jīng)網(wǎng)絡(luò)不容易訓(xùn)練殴胧。大的網(wǎng)絡(luò)可以認(rèn)為是很多小的子網(wǎng)絡(luò),子網(wǎng)絡(luò)不一定能訓(xùn)練出來(lái)佩迟,但是眾多子網(wǎng)絡(luò)只要其中一個(gè)人成功团滥,大的網(wǎng)絡(luò)就能成功。


上圖可以得出的結(jié)論:

  • 初始絕對(duì)值不重要音五,正負(fù)號(hào)才重要惫撰。


    反大樂(lè)透假說(shuō)

★★★★ Learning Efficient Convolution Network through Network Slimming


分值小的剪枝
對(duì)gama做正則

二、 知識(shí)蒸餾


先訓(xùn)練大的神經(jīng)網(wǎng)絡(luò)(Teacher)躺涝,進(jìn)行修剪再訓(xùn)練小的神經(jīng)網(wǎng)絡(luò)(Student)厨钻。如下圖所示:

學(xué)生訓(xùn)練的label為老師的預(yù)測(cè)的soft label繼續(xù)訓(xùn)練。直接訓(xùn)練小的神經(jīng)網(wǎng)絡(luò)不如從大的神經(jīng)網(wǎng)絡(luò)輸出結(jié)果進(jìn)行訓(xùn)練效果好坚嗜。這里認(rèn)為老師不僅學(xué)習(xí)到本身的label知識(shí)夯膀,還能學(xué)到隱含的知識(shí),比如17很像苍蔬,老師學(xué)習(xí)的結(jié)果通過(guò)soft label 非one-hot label通過(guò)概率可以知道很相近诱建,學(xué)生更容易去學(xué)習(xí)到,而讓小的神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)是非常難的事情碟绑。

image.png

這里該機(jī)制也類(lèi)似于ensemble的機(jī)制俺猿,就是組合多個(gè)模型輸出,接著通過(guò)小的網(wǎng)絡(luò)直接訓(xùn)練格仲,往往再很多比賽的時(shí)候使用該機(jī)制押袍。

三、 Parameter Quantization


  • using less bits to represent a value(用少bit減少空間存儲(chǔ)參數(shù))
  • weight clustering
  • Represent frequent clusters by less bits, represent rare clusters by more bits(e.g Huffman encoding

四凯肋、 Architecture Design

(Depthwise Separable Convolustion)


reference可防止overfitting





五谊惭、 Dynamic Computation


The network adjusts the computation it need.



不同階段有輸出,根據(jù)資源決定在哪里輸出端輸出


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市圈盔,隨后出現(xiàn)的幾起案子豹芯,更是在濱河造成了極大的恐慌,老刑警劉巖驱敲,帶你破解...
    沈念sama閱讀 211,123評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件铁蹈,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡众眨,警方通過(guò)查閱死者的電腦和手機(jī)木缝,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,031評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)围辙,“玉大人我碟,你說(shuō)我怎么就攤上這事∫ǎ” “怎么了矫俺?”我有些...
    開(kāi)封第一講書(shū)人閱讀 156,723評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)掸冤。 經(jīng)常有香客問(wèn)我厘托,道長(zhǎng),這世上最難降的妖魔是什么稿湿? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,357評(píng)論 1 283
  • 正文 為了忘掉前任铅匹,我火速辦了婚禮,結(jié)果婚禮上饺藤,老公的妹妹穿的比我還像新娘包斑。我一直安慰自己,他們只是感情好涕俗,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,412評(píng)論 5 384
  • 文/花漫 我一把揭開(kāi)白布罗丰。 她就那樣靜靜地躺著,像睡著了一般再姑。 火紅的嫁衣襯著肌膚如雪萌抵。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,760評(píng)論 1 289
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼乖阵。 笑死,一個(gè)胖子當(dāng)著我的面吹牛讨永,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蔽挠,決...
    沈念sama閱讀 38,904評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼住闯,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了澳淑?” 一聲冷哼從身側(cè)響起比原,我...
    開(kāi)封第一講書(shū)人閱讀 37,672評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎杠巡,沒(méi)想到半個(gè)月后量窘,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,118評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡氢拥,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,456評(píng)論 2 325
  • 正文 我和宋清朗相戀三年蚌铜,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片嫩海。...
    茶點(diǎn)故事閱讀 38,599評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡冬殃,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出叁怪,到底是詐尸還是另有隱情审葬,我是刑警寧澤,帶...
    沈念sama閱讀 34,264評(píng)論 4 328
  • 正文 年R本政府宣布奕谭,位于F島的核電站涣觉,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏血柳。R本人自食惡果不足惜官册,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,857評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望难捌。 院中可真熱鬧膝宁,春花似錦、人聲如沸根吁。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,731評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)婴栽。三九已至满粗,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間愚争,已是汗流浹背映皆。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,956評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留轰枝,地道東北人捅彻。 一個(gè)月前我還...
    沈念sama閱讀 46,286評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像鞍陨,于是被迫代替她去往敵國(guó)和親步淹。 傳聞我的和親對(duì)象是個(gè)殘疾皇子从隆,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,465評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容