論文讀不懂怎么辦幌陕?

悄悄告訴你幾個竅門。

image

痛苦

做科研汽煮,不能不讀論文搏熄。

但是,我見過不少研究生暇赤,論文都讀得愁眉苦臉的心例。

這其中,自然有因為拖延的關系鞋囊。例如教授布置了2周后討論論文止后,你原本可以每天抽出時間,慢慢消化∫胫辏可你非得拖到截止日期的前一天晚上才打開看瓜喇,希望畢其功于一役……這顯然是態(tài)度問題

但是歉糜,不可忽略的乘寒,有些同學,卻真的不是態(tài)度問題匪补,而是方法不當伞辛。

他們喜歡跟論文死磕

讀不懂夯缺,就一遍一遍反復讀蚤氏,試圖從字里行間,悟出精髓踊兜。

這可能是為了遵從那句古訓:

書讀百遍竿滨,其義自見。

且不說這樣是不是最終能走通捏境。只論這個過程姐呐,就很痛苦,而且事倍功半典蝌。

有的同學對著一篇論文發(fā)憤了幾天甚至是幾周,依然看不懂头谜。那種挫折骏掀、沮喪,別人看著都難受柱告。

問題出在哪里呢截驮?

困難

我在《如何與導師有效溝通你的論文選題?》一文給你講過际度,一篇合格的論文葵袭,就是傳遞認知差的載體。

更進一步乖菱,不斷涌現(xiàn)的論文坡锡,其實就是學術界的升級安裝包。

你不斷讀論文窒所,就是為了跟學術共同體保持同步鹉勒。但是,只有你跟這篇論文所依賴的那些基礎知識同步以后吵取,安裝這個升級包才有意義禽额,也才能水到渠成。

而對著論文犯愁的你,不管出于什么原因脯倒,顯然不大具備這個新包兒(論文)的安裝條件实辑。

所以,你需要做的藻丢,不是跟這篇論文自身較勁剪撬。而是應該盡快補充調(diào)整自己的知識架構(gòu),使得這篇論文對你而言郁岩,是可以兼容婿奔,并且升級的。

論文羅列的參考文獻问慎,可以作為你補充基礎知識的一個有效手段萍摊。畢竟,作者親自在這里為你指明的路徑如叼,如同給了你一張寫有路標的迷宮地圖冰木。

這就是為什么,許多優(yōu)秀的博士笼恰,都是要讀數(shù)百篇文獻的踊沸。

讀過那些文獻以后,再看什么新文獻社证,都會很有感覺逼龟,一下子就能找到方向,看到論文的優(yōu)勢和弱點追葡。

這時候腺律,你就已經(jīng)是個專業(yè)人士了。

但是宜肉,對于初學者而言匀钧,你得先讓自己樹立自信。而不是用一種近乎于閉卷考試的方法挑戰(zhàn)自己谬返。

做買賣不怕賠錢之斯,但是怕剛開張的時候賠錢。這是有道理的遣铝,因為“貧窮陷阱”曲線有多個均衡佑刷。

image

同樣,做科研也不怕面對困難翰蠢。但是初始階段项乒,還是得給自己降低一些難度。

許多時候梁沧,你要讀的論文來自陌生領域檀何,你并沒有那么多的時間,一篇篇文獻去啃、去挖掘频鉴。

舉個例子栓辜,假設你的研究方向,不是自然語言處理或者深度神經(jīng)網(wǎng)絡垛孔。但是你最近在學術研討會上聽說了一個神奇的東西藕甩,叫做 BERT 。

你自己學科里面的很多人周荐,都在談論他狭莱。他們用上了 BERT ,所以可以高精度概作、自動化處理很多從前只有人類才能做好的文本處理工作腋妙,例如情感分析,例如智能問答等讯榕。

見他們發(fā)了很好的論文骤素,你也想一探究竟。

你找到了 BERT 的原始論文愚屁,它就在預印本平臺 arxiv 上面济竹。

image

但是一打開,你就暈了霎槐。

image

這些術語(例如“fine-tuning”)送浊,這些圖,都是什么意思扒鸬罕袋?一點頭緒都沒有。

怎么辦碍岔?

好在,要讀懂論文朵夏,是有不少竅門的蔼啦。你可以善用許多從前忽視的資源,幫助自己消化和理解論文中令你感到困惑的部分仰猖。

下面我一一講給你聽捏肢。

幻燈

俗話說,解鈴還須系鈴人饥侵。

如果你覺得一個作者在論文中使用了很多公式鸵赫,而且表達晦澀,那是因為要發(fā)表躏升,他只需要顧及審稿人和領域內(nèi)小圈子專業(yè)人士的感覺就可以了辩棒。

為了表達效率高,他就得用術語。為了表達精準一睁,他就得用公式钻弄。

用術語,就是壓縮者吁;用公式窘俺,就是加密。

所以复凳,論文其實就是一個加密壓縮包瘤泪。

它安全,只有內(nèi)行看得懂育八,不會引來很多外行抬杠对途。

它高效,壓縮了所有冗余的信息单鹿。

但這搞得你這個初學者讀不懂掀宋,很不愉快。

你得先解密再解壓縮仲锄,然后才能看懂劲妙。可你癥結(jié)在于儒喊,你不具備解密和解壓的能力镣奋。

好在,每一個作者怀愧,都要同時面對兩個問題——共識知名度侨颈。

共識是說,別人承認他芯义;知名度是說哈垢,別人喜歡他。

要提升知名度扛拨,他就不能只悶頭寫論文耘分。還得出席一些會議,做做報告和講座什么的绑警。

面對大領域同行求泰,他要把一個事兒說清楚,就不能再用那么多的術語了计盒,而必須考慮到聽眾的感受主守。

這時候珊搀,他可能更多使用描述性語言褥赊,生動的例子蝌麸,甚至更吸引人的內(nèi)容拔第,例如視頻或者動圖。

這些會議的幻燈聊替,很多都是公開發(fā)布的楼肪。所以你不妨搜搜看。

例如說惹悄,你在搜索引擎里面搜索 BERT 那篇論文的第一作者春叫,加上 BERT 這個關鍵詞,以及把資源類型指定為 ppt 之后泣港,你就能看見很有趣的搜索結(jié)果了暂殖。

image

點開看看?

image

原來是 Jacob Devlin 在斯坦福大學一次演講的幻燈。

這里面当纱,清晰地定義了問題呛每,并且梳理了各種疑問的解答。

image

特別地坡氯,還使用了更多的圖形晨横,來對比 BERT 和現(xiàn)有技術之間的差異。

image

通過幻燈箫柳,你可以把論文中很多沒有能夠展開的問題手形,或者許多作者認為小領域同行默知默會的知識點,都詳細論述悯恍。

有了這些補充資源库糠,再回去讀論文,是不是更加清晰了涮毫?

博客

如果找不到作者的演示幻燈瞬欧,或者看了作者的幻燈之后,你還是沒能很好理解論文的內(nèi)容罢防,也不必氣餒艘虎。

我們前面說的,只是通則咒吐。

例如我們假定顷帖,作者面對一群不同背景的聽眾時,他的幻燈會做得更加深入淺出渤滞,以調(diào)眾口。

但是榴嗅,有些學者妄呕,就是不分場合跟你展示數(shù)學功底。指著一個包含超過30個數(shù)學符號的長式子興奮地說:

看嗽测,就是那么顯而易見……绪励!

這種情況下肿孵,如果他的工作足夠重要,你不必擔心疏魏,會有人站出來幫忙做解密和解壓停做,也就是“科普”這件事兒的。

目前學術界有幾個科普文和教程聚居地大莫。

其中我最喜歡的一個蛉腌,是 medium.com 。

BERT 論文出來之后不久只厘,你就可以在 Medium 上面查到這篇博文烙丛。

image

博文寫得如何?看看點贊(clap)次數(shù)也就知道了羔味。

image

標紅的地方顯示河咽,已經(jīng)有超過3800人點贊了。這在 Medium 平臺的學術科普類文章里赋元,算是非常受歡迎了忘蟹。

之后過了半個月,又有人寫了這篇搁凸。

image

隨后媚值,因為許多與 BERT 類似的 Transformers 模型競相出現(xiàn),所以 medium 平臺上的相關系列教程坪仇,也層出不窮杂腰。

image

例如發(fā)布在 2019 年 2 月 “How the Embedding Layers in BERT Were Implemented”一文中的這張手繪圖形,就把 BERT 為什么使用3種不同的嵌入層椅文,講得一清二楚喂很。

image

這些文章,可以讓你從一個感興趣的旁觀者角度皆刺,迅速建立相關概念少辣。有了這些基礎之后,再去讀論文羡蛾,你的感覺會輕松許多漓帅。

視頻

如果你足夠幸運的話,還能找到很好的視頻教程痴怨,作為補充資源忙干。

其中許多視頻,還是免費的浪藻。

例如 BERT 捐迫,就有不少人一言不合發(fā)視頻給大家講講清楚。

image

中英文視頻都有爱葵。而且排名靠前的這些教程施戴,往往都做得品質(zhì)精良反浓,讓你迅速了解 BERT 的來龍去脈。

我個人比較推薦那些大學老師做的視頻赞哗。當老師受到的最寶貴訓練雷则,絕不是什么師資班的培訓,而是上課的時候收獲的學生反饋肪笋。

因為總是給學生上課月劈,他會明白學生的關注點在哪里,會忽視或者錯誤理解什么涂乌,從而可以有的放矢強調(diào)某些東西艺栈,讓你輕易避開很多認知誤區(qū)陷阱。

例如說李宏毅老師講的 BERT 介紹湾盒,就可稱得上是深入淺出湿右,形象生動。

image

何況罚勾,還是中文的毅人。

課程

有的時候,你會發(fā)現(xiàn)尖殃,雖然某些令許多人關注的焦點內(nèi)容(例如 BERT )會有這樣多的視頻可供觀賞丈莺,但是若你想仔細了解一下論文里出現(xiàn)的其他技術,以便對比送丰,就未必有這么好的運氣了缔俄。

在視頻平臺上搜尋,也許很難有收獲器躏,甚至還會找到很多噪聲俐载。

這時候,你也不要氣餒登失。雖然你想看視頻教程遏佣,但如果只在某個視頻平臺搜索,那就如同魚在坑的東邊揽浙,你卻非得在坑西邊釣一樣状婶。

系統(tǒng)化了的知識,你沒有必要東奔西走地查找馅巷。而是可以通過在線課程來快速概覽膛虫。這樣不僅選擇成本低,而且學習效率更高钓猬。

有的同學天然把課程等同于幾大 MOOC 平臺稍刀。實際上,這也是一種誤解逗噩。

例如你打算回顧一下掉丽,自然語言處理近幾年的發(fā)展與技術應用。那么异雁,選擇 Coursera 或者 Udacity 課程捶障,自然也是一種辦法。

但你如果喜歡更靈活地學習纲刀,可以直接到 fast.ai 上面项炼。因為這里的特點是快速迭代,緊貼前沿示绊,而且剛好就有一門 NLP 課程锭部,內(nèi)容非常新穎。

image

課程內(nèi)容里面褐,自然也包括 BERT 拌禾。

image

而與此同時,它也囊括了 ULMfit, GPT-2 和 XLNet 等相關技術展哭。以寫代碼來理解不同技術的進展湃窍,邏輯清晰,讓你一站式了解領域里面最重要的內(nèi)容有哪些匪傍,特別是最近發(fā)生了什么有意思的事兒您市。

image

代碼

提到了代碼,咱們就多說幾句役衡。

Jeremy Howard 在他的課程里面一直強調(diào)茵休,對于技術類的問題,代碼比公式更重要手蝎。

image

描述一個算法榕莺,你用公式當然沒有問題。但如你能把它寫成代碼柑船,而且正確運行帽撑,那想必你是真的懂了

同樣鞍时,現(xiàn)在我們看很多論文亏拉,都配有代碼。

image

如果你讀論文的時候逆巍,只閱讀公式看算法及塘,搞不懂究竟是怎么回事兒,則完全可以去看看那簡單的 Python 代碼锐极。

例如說 BERT 笙僚,你雖然看到各種圖片,但是可能還是不知道灵再,如果你打算做一個分類下游任務肋层,該怎么給你的輸入文本做編碼呢亿笤?

這時候,如果你讀代碼栋猖,效果就大不相同了净薛。

當然,這里不是讓你去讀最初論文的代碼蒲拉。那是基于 Tensorflow 1.x 版本寫的肃拜。回顧一下雌团,我在《如何用 Python 和 BERT 做中文文本二元分類燃领?》里面,跟你介紹過 Tensorflow 1.x 設計上的反人性锦援。

你完全可以去讀 PyTorch 代碼猛蔽。至少讀起來,更像是人話雨涛。

有好事者枢舶,就把 Tensorflow 上的各種 Transformer 模型,都搬到了 PyTorch 上替久。目前這個叫做 Transformer 2.0 項目凉泄,在 github 上已經(jīng)有了16300顆星。

image

在論文里蚯根, BERT 模型輸入文本的預處理后众,是這個樣子的。你可能會很疑惑颅拦,特殊的 token (例如論文中出現(xiàn)的 [CLS][SEP] )蒂誉,究竟如何設置,如何起作用距帅?

image

這里右锨,看一下代碼示例。你會發(fā)現(xiàn)碌秸,原來你該這樣把它們加入進去绍移。

image

而且,只有真正看了代碼倉庫里面的示例讥电,你才會了解蹂窖, transformers 這個項目,為什么會這么火恩敌。

因為瞬测,你可以僅僅用10幾條語句,就完成一個經(jīng)典的文本分類任務。

image

于是月趟,你也就明白灯蝴,在自己的研究任務里面,用上最前沿的自然語言處理技術孝宗,根本就沒有預想得那么困難绽乔。

小結(jié)

本文我們以 BERT 為例,為你講述了當直接閱讀科研論文時遭遇困難的原因碳褒,以及你可以求助的免費資源和路徑,它們包括但不限于:

  • 幻燈看疗。作者用幻燈和聽眾溝通的時候沙峻,是要在一定程度上,放棄術語和公式的便利的两芳。這就給你一個聽懂的機會摔寨。
  • 博客。對于一個大家都認為有用怖辆,但是學起來很困難的知識點是复。你可以在主流技術博客平臺上找一找,很可能會有驚喜竖螃。
  • 視頻淑廊。視頻教程的好處,是可以用更為形象生動的方式特咆,給你展現(xiàn)動態(tài)的過程季惩。而且,有時你還能直接感受到講者的幽默腻格。
  • 課程画拾。如果你需要形成知識基礎,系統(tǒng)化的課程可以讓這一過程快捷高效菜职。
  • 代碼青抛。對于那些技術性的問題,數(shù)學描述算法有時候會讓人有疑惑酬核。這時候蜜另,閱讀源代碼,甚至編程實踐出來愁茁,會極大提升你的理解程度蚕钦。

當然,這不是全部鹅很。

最好的方式嘶居,當然是與專家甚至是作者本人,做面對面的高效溝通反饋。當然邮屁,這樣的機會很稀缺整袁。如果你遇到,一定要抓住佑吝。

專欄

告訴你一個好消息坐昙。

我在少數(shù)派(sspai)的第一個訂閱專欄《科研新手全面入坑指南》(https://sspai.com/series/75)已正式上線了。

image

這是我對科研方法與工具類文章的匯總芋忿、梳理與升級炸客。之前的文章,我用文內(nèi)和文末鏈接的方式戈钢,幫你找尋相關內(nèi)容和前導知識痹仙。但是,這樣讀者很容易迷失在鏈接的網(wǎng)絡中殉了,難以形成系統(tǒng)化的知識和技能架構(gòu)开仰。

少數(shù)派發(fā)現(xiàn)了這個痛點,并且和我一起薪铜,投入了大量的精力解決它众弓。

文章的排布,是我和編輯團隊重新修整和梳理過的隔箍。專業(yè)的編輯和美工幫我把它們變得更加緊湊谓娃、邏輯化,也更美觀和有趣蜒滩。

我用20多篇教程傻粘,為你介紹初窺研究門徑的研究生與高年級的本科生,很需要了解的一些科研基礎知識帮掉。包括但不限于如何選題弦悉、如何讀文獻、如何快速寫初稿……這些知識蟆炊,你的導師大約會默認你已經(jīng)學會稽莉,因此不會手把手教給你。但是你若做不到涩搓,導師很可能會覺得你基礎不牢污秆,或者不用心。你唯一能做的昧甘,就是盡快把它們補充齊備良拼,以便減輕剛剛走上科研之路時的痛苦,保護好你的好奇心與成就感充边。

除了方法庸推,我還介紹一些工具給你常侦。例如 VosViewer 。 它可以幫助你快速掃描中英文領域文獻贬媒,發(fā)現(xiàn)作者聋亡、主題之間的微妙關聯(lián)。由此际乘,你就可以快速識別已有研究的盲點坡倔、盲區(qū),甚至是盲維脖含,從而有的放矢地找到自己研究的獨特定位與價值罪塔。

如果你正在發(fā)愁畢業(yè)論文該怎么著手做,那么這是個很好的入手時機养葵。

本文發(fā)布時垢袱,因為少數(shù)派的雙十一促銷活動,該專欄正在限時八折銷售港柜。

愿熱愛學習的你,科研之路從此走得更加扎實與順暢咳榜。

讀過本文夏醉,如果覺得有收獲,請點贊涌韩。

要讀更多的文章畔柔,微信關注我的公眾號“玉樹芝蘭”(nkwangshuyi)。別忘了加星標臣樱,以免錯過新推送提示靶擦。

如果本文對你身邊的親友有幫助,也歡迎你把本文通過微博或朋友圈分享給他們雇毫。

延伸閱讀

你可能也會對以下話題感興趣玄捕。點擊鏈接就可以查看。

題圖: Photo by Tim Gouw from Pexels

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市局骤,隨后出現(xiàn)的幾起案子攀圈,更是在濱河造成了極大的恐慌,老刑警劉巖峦甩,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件赘来,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機撕捍,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門拿穴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人忧风,你說我怎么就攤上這事默色。” “怎么了狮腿?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵腿宰,是天一觀的道長。 經(jīng)常有香客問我缘厢,道長吃度,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任贴硫,我火速辦了婚禮椿每,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘英遭。我一直安慰自己间护,他們只是感情好,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布挖诸。 她就那樣靜靜地躺著汁尺,像睡著了一般。 火紅的嫁衣襯著肌膚如雪多律。 梳的紋絲不亂的頭發(fā)上痴突,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天,我揣著相機與錄音狼荞,去河邊找鬼辽装。 笑死,一個胖子當著我的面吹牛相味,可吹牛的內(nèi)容都是我干的如迟。 我是一名探鬼主播,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼攻走,長吁一口氣:“原來是場噩夢啊……” “哼殷勘!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起昔搂,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤玲销,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后摘符,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體贤斜,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡策吠,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了瘩绒。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片猴抹。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖锁荔,靈堂內(nèi)的尸體忽然破棺而出蟀给,到底是詐尸還是另有隱情,我是刑警寧澤阳堕,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布跋理,位于F島的核電站,受9級特大地震影響恬总,放射性物質(zhì)發(fā)生泄漏前普。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一壹堰、第九天 我趴在偏房一處隱蔽的房頂上張望拭卿。 院中可真熱鬧,春花似錦贱纠、人聲如沸峻厚。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至换途,卻和暖如春懊渡,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背军拟。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工剃执, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人懈息。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓肾档,卻偏偏與公主長得像,于是被迫代替她去往敵國和親辫继。 傳聞我的和親對象是個殘疾皇子怒见,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345