文獻(xiàn)閱讀的意義和價值
對于研究生新生而言,剛開學(xué),必不可少的就是接觸閱讀文獻(xiàn)這樣一件差事。通過閱讀文獻(xiàn)餐济,一方面我們可以了解這個領(lǐng)域的專家/學(xué)者最近在研究什么,可以從中收獲新的insight和知識胆剧,另一方面絮姆,我們也可以借助這個機(jī)會,學(xué)習(xí)學(xué)術(shù)論文撰寫的方法和討論秩霍,了解寫作技術(shù)篙悯,此外,我們還可以以此來評估今后自己的工作是處于什么level铃绒,適合什么層次的會議/期刊鸽照。
會議和期刊的區(qū)別
首先了解下會議和期刊的主要區(qū)別颠悬。
會議
一般而言矮燎,會議文章審稿周期短,錄用速度快赔癌,比較直接诞外,部分頂會增加了rebuttal的過程,即有一次審稿人反饋信息灾票,作者對審稿人的問題進(jìn)行一一辯駁解釋峡谊,以消除審稿人的疑慮(concerns)。對于會議,除了審稿周期短外既们,如計算機(jī)的會議濒析,要求內(nèi)容很新,可能會是有新的問題啥纸, 也要求有新的方法号杏,尤其是對于做應(yīng)用(application)的同學(xué)而言。
期刊
而期刊斯棒,往往審稿周期很長盾致,會反復(fù)修改,對內(nèi)容要求是全文內(nèi)容全面名船,推導(dǎo)、實驗完整旨怠,有較完備的分析和討論渠驼,即“全”。而對新穎的要求會略低于頂級會議鉴腻。
文獻(xiàn)閱讀
下面就談?wù)勅绾伍喿x一篇文獻(xiàn)迷扇。一般一篇文章分為Abstract、Introduction爽哎、Related work蜓席、 Methods、Experiments和Conclusion這六個主要部分课锌。
Abstract
當(dāng)然第一部分是Abstract厨内,這部分是一個工作總覽,一般會包含研究的問題what渺贤、研究意義價值significance雏胃、主要方法 recent works、挑戰(zhàn) still remain challenging due to XX(沒解決的問題)志鞍、我們提出的框架(we propose xxx to address xxx)瞭亮、涉及的主要方法(e.g. xxx and then xx, extract the interacted relationship...)、實驗結(jié)果與結(jié)論(Experimental results illustrate xx 提升了多少 outperforms other baselines)
通過讀它我們可以快速了解全文的研究內(nèi)容和主要方法固棚,從而決定這篇文章和自己研究方向的相關(guān)程度统翩,確定是否需要花很多時間進(jìn)行精讀,或者依據(jù)此也可以確定興趣程度此洲,來確定如何閱讀全文厂汗。
Introduction
接著是閱讀introduction,我們一般從以下幾個方面來對intro進(jìn)行評估呜师,汲取希望獲得的知識(內(nèi)容):
1.significance(意義)為什么研究
2.motivation (技術(shù))
challenges
3.相關(guān)工作 related work 表明自己的與他們其實不同的 problem,method
4.Methods & Main Contribution (Methods 是針對challenges提出的面徽,contributions一般需要從兩個方面理解,一個為研究的問題problem,另一個是technique contribution即模型技術(shù)上的貢獻(xiàn))
對照主要貢獻(xiàn)趟紊,當(dāng)我們自己有了idea的時候氮双,就可以對照這些文章來評估自己的想法處于什么層次level,是否適合這些會議/期刊霎匈,哪些是適合我的戴差,我還可以針對哪些方面做哪些提升。
Related work
接下來是閱讀related work铛嘱。
這部分工作的閱讀我們需要從中了解到相關(guān)工作的寫作方法暖释,別人是如何闡述相關(guān)工作的,這些工作和我們工作的關(guān)聯(lián)是什么墨吓,不同點(diǎn)在哪里球匕,針對本文的contribution,來提別人的工作帖烘,并針對性的給出分析亮曹,指出研究的不同點(diǎn)和方法的不同點(diǎn)。
Methods
對于Methods方法部分秘症,我們需要著重把握文章提出的模型是什么
對于一般的機(jī)器學(xué)習(xí)模型照卦,可以拆分為模型和數(shù)據(jù)兩個大塊。
數(shù)據(jù):輸入是什么(features) 輸出是什么 y, prediction
模型:模型框架即結(jié)構(gòu)是什么(structure)
模型的損失函數(shù)如何設(shè)計(定義)loss function 是否有正則化
這個模型和別人以往工作的模型創(chuàng)新點(diǎn)在哪里乡摹,是基于什么motivation的役耕,即基于某個observation(什么樣的規(guī)律或者觀測或者發(fā)現(xiàn),在這個發(fā)現(xiàn)的基礎(chǔ)上聪廉,我們對過往的模型提出了改進(jìn))
Experiments
對于這一部分瞬痘,我們一般需要關(guān)注作者是如何設(shè)計這個實驗的,如何控制變量板熊,這些實驗設(shè)計出來的目的是什么图云,即為了驗證什么。
如模型本身準(zhǔn)確率很高邻邮?
某一單個模塊很有效竣况? 尤其是自己提出的方法 設(shè)計的模塊 更應(yīng)當(dāng)驗證其有效性
是否有做消融實驗?
實驗結(jié)果的分析:
是怎么去表達(dá)數(shù)據(jù)的不同(變化)的筒严,如何表達(dá)好的丹泉,如何規(guī)避“不太好”的實驗結(jié)果。
一般需要縱向比(即和不同的模型比鸭蛙,我們的模型總體上都比其他同類或不同類的模型效果都要好一些)
一般還需要橫向比(即和自己比摹恨,做消融實驗,消去自己模型的不同模塊 評估準(zhǔn)確率娶视,為了得到不同模塊都是對結(jié)果優(yōu)化起正面作用的)
Conclusion
這一部分往往會闡述(回顧)本文的研究問題和主要方法晒哄,進(jìn)一步的提出未來工作展望睁宰。可能部分文章(尤其是期刊)會增加“討論”這一部分寝凌,讓讀者明白其模型其設(shè)計的motivation及其設(shè)計的小弊端柒傻、小缺陷(這樣做的好處是承認(rèn)問題 避免審稿人再挑刺)。
這部分可以學(xué)習(xí)到結(jié)論部分是如何重復(fù)闡述問題(和abstract類似而又表達(dá)語句不同的)怎么指未來的研究方向较木。以及什么樣的小弊端是可以在論文最后提红符,而有些弊端是不用提的,避免麻煩伐债。
實時記錄好的句子和想法
以上就是初學(xué)者閱讀論文的主要思路和方法预侯,并且在閱讀過程中,遇到好的表達(dá)方式可以進(jìn)行記錄峰锁,并標(biāo)記這種表達(dá)一般用在什么地方萎馅,方便今后寫作時調(diào)取進(jìn)行模仿寫作。
略讀
在閱讀完一定量的論文具有了一定積累后虹蒋,可以試著粗略閱讀糜芳,比如我們只是想看看方法和技巧,那么我們可以快速閱讀摘要千诬,模型的框架(Framework)從而可以看到模型的主要貢獻(xiàn)在哪里耍目,通過掃描實驗可以大致看到實驗的設(shè)計和主要結(jié)果膏斤。