不愿意看那一堆公式符號(hào)割卖,卻想知道卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network)如何做圖像分辨鹏溯?分享一段我給自己研究生的講解答疑視頻,希望對(duì)你有幫助肺孵。
茫然
常有朋友問(wèn)平窘,我的Python和數(shù)據(jù)科學(xué)課程開(kāi)在哪個(gè)學(xué)期凳怨,他們想過(guò)來(lái)蹭課。
不好意思磅叛,這個(gè)真沒(méi)有弊琴。
我寫(xiě)了一系列的數(shù)據(jù)科學(xué)教程杖爽。但原本只是給我自己的研究生賦能慰安,并非課程講義。
他們有的人萄窜,本科學(xué)的專業(yè)查刻,與技術(shù)毫不沾邊凤类。
但是情報(bào)學(xué)是個(gè)交叉學(xué)科谜疤。尤其是近幾年,與數(shù)據(jù)科學(xué)融合愈發(fā)深入履肃。
往周圍看看尺棋,其他社會(huì)科學(xué)專業(yè)撕攒,例如新聞學(xué)抖坪、心理學(xué)、社會(huì)學(xué)脊阴、政治學(xué)等,都在利用開(kāi)放互聯(lián)網(wǎng)數(shù)據(jù)集品擎,做以往無(wú)法想象的大規(guī)模信息分析萄传。
在這種情況下蜜猾,你一個(gè)情報(bào)學(xué)研究生蹭睡,處在原本就有數(shù)據(jù)分析優(yōu)勢(shì)的學(xué)科,卻一點(diǎn)兒也不掌握數(shù)據(jù)科學(xué)技能脊串,出門(mén)好意思跟其他同學(xué)打招呼嗎清钥?
于是我給他們寫(xiě)教程循捺,寫(xiě)盡量讓文科生能看懂的教程。
事實(shí)證明念赶,他們能跟著教程叉谜,做出來(lái)結(jié)果踩萎。
但是香府,我在《Python編程遇問(wèn)題企孩,文科生怎么辦?》中說(shuō)過(guò)擒抛,“照葫蘆畫(huà)葫蘆”,只是你入門(mén)數(shù)據(jù)科學(xué)的第一步歹撒。
你需要理解技術(shù)應(yīng)用的前提和方法暖夭,這樣才能應(yīng)對(duì)自己的研究問(wèn)題厢钧,利用適當(dāng)工具早直,加以解決市框。
本周的組會(huì)上,我聽(tīng)一年級(jí)研究生論文翻譯展示枫振,明顯感覺(jué)他們對(duì)于卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與原理喻圃,依然不清楚。
我很奇怪粪滤。
因?yàn)槲覍iT(mén)為他們寫(xiě)過(guò)至少2篇文章斧拍,都是講如何利用卷積神經(jīng)網(wǎng)絡(luò)做圖像處理的。
而且杖小,他們還用自己的數(shù)據(jù)集肆汹,重新做過(guò)訓(xùn)練與測(cè)試。
在文章里予权,我還給他們介紹了深度學(xué)習(xí)模型的基本原理,并且在文末詳細(xì)列出了參考資料扫腺,供延伸閱讀岗照。
這么長(zhǎng)時(shí)間過(guò)去了,怎么還是懵懵懂懂笆环?
倘在從前攒至,我肯定要訓(xùn)人了。
因?yàn)樵趺纯丛炅樱@都是學(xué)習(xí)態(tài)度不端正的問(wèn)題迫吐。
但是,有了同理心訓(xùn)練基礎(chǔ)习绢,我突然能夠理解他們的茫然與苦惱了渠抹。
同理
他們看到的延伸閱讀材料蝙昙,像一個(gè)黑洞。
這個(gè)黑洞吸收他們的時(shí)間和工作量梧却,卻看不到任何正反饋奇颠。
因?yàn)樗麄內(nèi)狈A(chǔ)。
要學(xué)好深度神經(jīng)網(wǎng)絡(luò)放航,并不需要多么高人一等的智慧烈拒。但是一些基礎(chǔ)要件卻很重要。這些基礎(chǔ)包括:
- 編程
- 數(shù)學(xué)
- 英語(yǔ)
如果有這3個(gè)基礎(chǔ)广鳍,你根本無(wú)需導(dǎo)師幫助荆几。自修 Coursera 上 Andrew Ng 《深度學(xué)習(xí)》這樣的精品MOOC課程,就會(huì)讓你成長(zhǎng)迅速赊时,大呼過(guò)癮吨铸。
可是對(duì)國(guó)內(nèi)的文科生來(lái)說(shuō),上面列出的幾個(gè)基礎(chǔ)要件祖秒,可謂是“三座大山”诞吱,能壓得他們寸步難行。
編程沒(méi)學(xué)過(guò)竭缝,數(shù)學(xué)早忘了房维,英語(yǔ)不過(guò)關(guān)。
你讓他們一點(diǎn)一滴從頭學(xué)起抬纸,全部補(bǔ)齊咙俩?
即便真補(bǔ)完整了,也該畢業(yè)了湿故。
還做什么研究阿趁?
誠(chéng)然,老師可以幫助他們精簡(jiǎn)學(xué)習(xí)模塊晓锻。
編程不好歌焦,沒(méi)關(guān)系。
不要去碰 Tensorflow 的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搭建細(xì)節(jié)語(yǔ)句?砚哆,只要會(huì)用最簡(jiǎn)單的 TuriCreate 調(diào)用遷移學(xué)習(xí)工具独撇,幾行代碼搞定圖像識(shí)別。
英語(yǔ)不好躁锁,沒(méi)事兒纷铣。
我把教程給你用中文寫(xiě)出來(lái)。你直接照著做战转,就能出結(jié)果搜立。
但是數(shù)學(xué)不好,理解不了神經(jīng)網(wǎng)絡(luò)模型的原理槐秧,怎么辦啄踊?
從前我也是束手無(wú)策忧设。
要么把整個(gè)工具當(dāng)作黑箱,只知道輸入輸出颠通,就能做出結(jié)果來(lái)址晕。
但這是用戶的態(tài)度,不是研究者的態(tài)度顿锰。
這種低水準(zhǔn)認(rèn)知谨垃,可能讓你有機(jī)會(huì)充分實(shí)踐什么叫“垃圾進(jìn),垃圾出”硼控。
很多對(duì)統(tǒng)計(jì)學(xué)一無(wú)所知的學(xué)生刘陶,不就是這么玩兒SPSS的嗎?
想到這里牢撼,我突然靈光一閃匙隔。
借鑒
統(tǒng)計(jì)學(xué)對(duì)很多文科生,也很難學(xué)浪默。
他們是通過(guò)什么途徑學(xué)會(huì)的呢牡直?
是一種“有限度拆解”。
只學(xué)會(huì)導(dǎo)入數(shù)據(jù)纳决,點(diǎn)按鈕出圖表,顯然不夠用乡小。
但是從頭推各種分布的公式阔加,講解閾值設(shè)定(例如那個(gè)神奇的0.7)的原理……人早就跑掉了。
怎么辦满钟?
我想起來(lái)了李連江教授的這本書(shū)胜榔。
李老師的態(tài)度,是原理要講清楚湃番,不能讓學(xué)生隨便“拷打”數(shù)據(jù)夭织。
但是又不能深入到底層數(shù)學(xué)原理,那樣很多文科生根本就看不懂吠撮,甚至?xí)芸靻适У襞d趣尊惰。
他的辦法,簡(jiǎn)單而實(shí)際泥兰。
就是舉例子和打比方弄屡。
用一個(gè)SPSS自帶的雇員例子,他解釋了好幾章的內(nèi)容鞋诗。從數(shù)據(jù)的類型膀捷,一直到多元回歸。
因?yàn)橛辛藢?shí)際樣例削彬,學(xué)生充分代入全庸,就好理解秀仲。
講到因子分析,做旋轉(zhuǎn)壶笼。這個(gè)怎么講神僵?
他用了兩個(gè)比喻。
一個(gè)是三大男高音拌消,代表3個(gè)因子挑豌。
三大男高音同臺(tái)的演唱會(huì),觀眾如潮墩崩。
有的觀眾愛(ài)聽(tīng)多明哥氓英,有的愛(ài)聽(tīng)卡雷拉斯,有的是沖著帕瓦羅蒂來(lái)的鹦筹。
但是觀眾們都坐在一起铝阐,你分不清哪個(gè)觀眾究竟是哪位歌唱家的粉絲。
怎么辦铐拐?
讓男高音們分開(kāi)唱徘键,唱對(duì)臺(tái)戲。
這是第二個(gè)比喻遍蟋。
一旦有對(duì)臺(tái)戲吹害,觀眾選擇的座位,就明確代表了態(tài)度虚青。
某個(gè)問(wèn)項(xiàng)它呀,歸屬于哪個(gè)因子,也同樣可以通過(guò)因子唱對(duì)臺(tái)戲(旋轉(zhuǎn))來(lái)分辨棒厘。
讀了《戲說(shuō)統(tǒng)計(jì)》纵穿,我覺(jué)得講得真好。
但是我后來(lái)看了李老師的課程視頻奢人,覺(jué)得收獲更大谓媒。
因?yàn)橐曨l的信息傳播更加豐富。
同樣是剛才的例子何乎,因?yàn)橛辛藞D像化解讀句惯,學(xué)生可以理解得更加透徹而深刻。
尤其是宪赶,每當(dāng)講到研究中統(tǒng)計(jì)結(jié)果出來(lái)宗弯,需要一些“不足為外人道”、“社會(huì)科學(xué)界有共識(shí)”的操作手法搂妻,李老師的笑容蒙保,總能讓人跟著忍俊不禁。
講解
有了李連江老師的例子做參考欲主,我用組會(huì)的剩余時(shí)間邓厕,以板書(shū)的形式逝嚎,一步步為研究生們講解了以下內(nèi)容:
- 深度神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu);
- 神經(jīng)元的計(jì)算功能實(shí)現(xiàn)详恼;
- 如何對(duì)深度神經(jīng)網(wǎng)絡(luò)做訓(xùn)練补君;
- 如何選擇最優(yōu)的模型(超參數(shù)調(diào)整);
- 卷積神經(jīng)網(wǎng)絡(luò)基本原理昧互;
- 遷移學(xué)習(xí)的實(shí)現(xiàn)挽铁;
- 疑問(wèn)解答。
我沒(méi)有追求最大化的嚴(yán)謹(jǐn)敞掘,也沒(méi)有對(duì)例子的通用性和實(shí)用性做更多的要求叽掘,只是從頭到尾,把一個(gè)簡(jiǎn)化到極致的圖像識(shí)別模型玖雁,與客戶流失預(yù)判模型進(jìn)行了對(duì)比講解更扁。
同樣的,我用了樣例赫冬,也用了打比方浓镜,盡力把聽(tīng)講的認(rèn)知負(fù)荷,降到最低劲厌。
過(guò)程中膛薛,我要求學(xué)生隨時(shí)提問(wèn)。因此交互很密切补鼻。
講解完畢后相叁,他們幾個(gè)表示,這下終于弄懂了卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí)辽幌。
由于最近閻教練的工作坊訓(xùn)練了視覺(jué)記錄行為,我講了幾分鐘后椿访,突然覺(jué)察到這一段可以錄下來(lái)乌企,分享給更多人。
于是我讓坐在前排的楊文同學(xué)成玫,幫我錄制了視頻加酵。
視頻中沒(méi)有能包含最初的幾分鐘內(nèi)容,即剛才列表的前兩個(gè)部分哭当。頗為遺憾猪腕。
不過(guò)沒(méi)關(guān)系,過(guò)一段時(shí)間后钦勘,我準(zhǔn)備組會(huì)時(shí)讓研究生上講臺(tái)陋葡,把這一段復(fù)述一遍,作為學(xué)習(xí)效果檢查彻采。
如果他們做得好腐缤,我會(huì)錄下來(lái)捌归,分享給大家。
他們還不知道我的打算岭粤。
所以你看見(jiàn)后惜索,別告訴他們。噓剃浇!
這段視頻時(shí)長(zhǎng)接近30分鐘巾兆,不算短。
如果你和他們一樣虎囚,讀過(guò)了我的《如何用Python和深度神經(jīng)網(wǎng)絡(luò)鎖定即將流失的客戶角塑?》、《如何用Python和深度神經(jīng)網(wǎng)絡(luò)識(shí)別圖像溜宽?》和《如何用Python和深度神經(jīng)網(wǎng)絡(luò)尋找近似圖片吉拳?》這幾篇文章,但是對(duì)于深度神經(jīng)網(wǎng)絡(luò)的原理構(gòu)造還是迷茫适揉,建議你從頭看到尾留攒,可能會(huì)有一些收獲。
歡迎點(diǎn)擊這個(gè)鏈接嫉嘀,觀看視頻炼邀。
有言在先,因?yàn)槭羌磁d講解剪侮,沒(méi)有任何準(zhǔn)備拭宁。內(nèi)容如有疏漏,在所難免瓣俯。
歡迎各位高手幫助指出紕漏杰标,我會(huì)在將來(lái)的講解中,迭代改進(jìn)彩匕。
提前謝過(guò)腔剂!
討論
你是如何學(xué)會(huì)卷積神經(jīng)網(wǎng)絡(luò)工作原理的?對(duì)于研究中遇到的數(shù)學(xué)公式驼仪,你有沒(méi)有什么更好的辦法理解和掌握呢掸犬?歡迎留言,把你的經(jīng)驗(yàn)和思考分享給大家绪爸,我們一起交流討論湾碎。
喜歡請(qǐng)點(diǎn)贊。還可以微信關(guān)注和置頂我的公眾號(hào)“玉樹(shù)芝蘭”(nkwangshuyi)奠货。
如果你對(duì)數(shù)據(jù)科學(xué)感興趣介褥,不妨閱讀我的系列教程索引貼《如何高效入門(mén)數(shù)據(jù)科學(xué)?》,里面還有更多的有趣問(wèn)題及解法呻顽。