科研漫談——如何進(jìn)行知識(shí)整理

??本文是我在2017年9月團(tuán)隊(duì)Workshop上所講內(nèi)容的底稿恨旱。為方便各位同學(xué)學(xué)習(xí)交流念搬,發(fā)布于此瓷产。

寫(xiě)此文的動(dòng)機(jī)

??曾幾何時(shí),我也是一只剛進(jìn)入科研的小萌新按摘。剛?cè)腴T(mén)的時(shí)候有著一腔熱情包券,但是每每閱讀文獻(xiàn),尤其是高水平的文獻(xiàn)的時(shí)候炫贤,總免不了產(chǎn)生一種知難而退之感溅固。究其原因,主要來(lái)自于兩方面:

  1. 英語(yǔ)水平不過(guò)關(guān)照激,專(zhuān)業(yè)詞匯需要反復(fù)查发魄。

  2. 基礎(chǔ)知識(shí)點(diǎn)不足,常常出現(xiàn)大坑需要填俩垃。

??這兩方面因素使得閱讀文獻(xiàn)花費(fèi)了巨大的時(shí)間成本励幼。如果要重復(fù)文獻(xiàn)中的方法或是案例,那么花費(fèi)的時(shí)間會(huì)更多(因?yàn)閹缀趺恳痪湓?huà)都要反復(fù)地讀)口柳。

??第一點(diǎn)好彌補(bǔ)苹粟,很多詞見(jiàn)得次數(shù)多了自然就熟了。第二點(diǎn)就難了跃闹,即使是同樣的一種技術(shù)/一個(gè)模型/一種方法嵌削,不同的文章中運(yùn)用的方式也會(huì)大相徑庭毛好,而且,作為以應(yīng)用為導(dǎo)向的會(huì)議或者期刊論文來(lái)說(shuō)苛秕,沒(méi)有必要把方法論完整的敘述一遍肌访。也就是說(shuō),這一點(diǎn)并不是多讀論文就能彌補(bǔ)的艇劫。

??那么吼驶,如何有效的解決這個(gè)問(wèn)題呢?幾年后的今天回過(guò)頭來(lái)看這個(gè)問(wèn)題店煞,發(fā)現(xiàn)自己走了非常多的彎路蟹演,但也有幸走出了這種困境。雖然無(wú)法一時(shí)間將所有的知識(shí)傾囊相授顷蟀,但是我想通過(guò)此文提出一個(gè)理解我們所研究問(wèn)題的一個(gè)基本的框架酒请。我希望通過(guò)運(yùn)用這套方法能夠?qū)ψx者有所幫助。

  1. 當(dāng)你開(kāi)始閱讀一篇本專(zhuān)業(yè)的新論文鸣个,你可以迅速地給它在研究領(lǐng)域內(nèi)的位置羞反;

  2. 通過(guò)知識(shí)整理,你可以知道你要從哪些地方開(kāi)始你的研究工作毛萌。

理解交通規(guī)劃與管理問(wèn)題

出發(fā)點(diǎn)

??我的專(zhuān)業(yè)是交通運(yùn)輸規(guī)劃與管理苟弛,這是一個(gè)涉及面非常廣的學(xué)科,其研究的內(nèi)容從研究對(duì)象上來(lái)說(shuō)阁将,包括城市道路道路交通膏秫,城市軌道交通,鐵路運(yùn)輸做盅,航空運(yùn)輸?shù)如拖鳎粡臅r(shí)間范圍上來(lái)說(shuō),涵蓋從規(guī)劃問(wèn)題(如動(dòng)車(chē)段所選址)到運(yùn)營(yíng)控制(如列車(chē)調(diào)度)吹榴。在研究當(dāng)中往往會(huì)讀到非常多的論文亭敢,其研究的問(wèn)題,問(wèn)題的表達(dá)和解決問(wèn)題的方法多種多樣图筹。如何快速的理解論文描述的問(wèn)題呢帅刀?我以供求關(guān)系為理解問(wèn)題的出發(fā)點(diǎn)。

1.png

??“供”是指供給远剩,在鐵路運(yùn)輸中扣溺,列車(chē)上的每一個(gè)席位就是供給的一種形式;“需”是指客運(yùn)需求瓜晤,這是一個(gè)抽象的概念锥余。產(chǎn)生需求的主體是人,比如“我想明天從北京去上毫÷樱”表達(dá)了我的一種需求驱犹。交通規(guī)劃與管理的問(wèn)題背景都可以看做是供需關(guān)系在不同維度上的體現(xiàn)嘲恍。

供給——管理優(yōu)化

??在研究的問(wèn)題中,供給往往會(huì)受到非常多的約束雄驹。最基本的約束來(lái)自于時(shí)空的約束佃牛,比如,一條鐵路線上不能無(wú)限制的開(kāi)車(chē)医舆,因?yàn)橐WC安全吁脱;動(dòng)車(chē)組不能無(wú)休止的運(yùn)行,因?yàn)橐S修彬向;在內(nèi)陸火車(chē)上吃不到海鮮,因?yàn)檫\(yùn)過(guò)來(lái)時(shí)間不夠(過(guò)保質(zhì)期)攻冷;列車(chē)不能無(wú)限制的賣(mài)票娃胆,因?yàn)檐?chē)上席位有限。

??解決上述的問(wèn)題等曼,除了引入新的資源以外(更高時(shí)速的列車(chē)里烦,調(diào)整修程修制,換用席位更多的車(chē)型)外禁谦,更多的情況是有效的對(duì)現(xiàn)有資源進(jìn)行有效組織胁黑。在這里我把這些手段統(tǒng)一稱(chēng)作“優(yōu)化管理”。通常州泊,解決這一類(lèi)問(wèn)題的手段是通過(guò)更好的計(jì)劃或者是控制丧蘸。我先簡(jiǎn)單區(qū)分一下這兩者的區(qū)別。

??計(jì)劃:在何時(shí)何地進(jìn)行何種操作遥皂。如力喷,“11時(shí)30分XXX次列車(chē)從北京南站發(fā)車(chē)”,“10時(shí)-11時(shí)發(fā)出這種方案線的列車(chē)頻率為5”演训。

??控制:根據(jù)當(dāng)前的狀況調(diào)整/制定計(jì)劃弟孟。如,“當(dāng)XXX次列車(chē)晚點(diǎn)样悟,運(yùn)行圖進(jìn)行……調(diào)整”拂募。

??根據(jù)優(yōu)化目標(biāo)的不同,模型的構(gòu)建會(huì)基于Scheduling或Optimal Control兩類(lèi)理論框架窟她。當(dāng)然陈症,不同論文里面因?yàn)槊枋龅膯?wèn)題不同,所構(gòu)建的具體模型不同礁苗,但基本都符合這兩類(lèi)框架爬凑。

需求——現(xiàn)象描述

??在供給對(duì)面的是形態(tài)各異的需求。需求中可以包含的信息是非常多的试伙。我們不可能在解決所有的問(wèn)題中都把所有關(guān)于需求的信息都用上嘁信,因?yàn)檫@是不必要且難于操作的于样。因而針對(duì)不同的問(wèn)題(管理優(yōu)化的目標(biāo))我們選取哪些信息,以及如何準(zhǔn)確地把需求描述出來(lái)是最關(guān)鍵問(wèn)題潘靖。

??對(duì)需求的描述從最宏觀到最微觀的一個(gè)例子穿剖。

信息1:“有100人明天想從北京去上海∝砸纾”

信息2:“50個(gè)人更傾向于火車(chē)出行糊余,50人想要坐飛機(jī)〉ゼ牛”

信息3:“傾向于火車(chē)出行的旅客傾向于坐上午10:00的火車(chē)贬芥。”

信息4:“如果火車(chē)票漲價(jià)500元宣决,有20個(gè)人改乘坐飛機(jī)蘸劈。”

……

信息N:“小明明天上午10點(diǎn)在上海有個(gè)會(huì)議尊沸;小王希望最近幾天去上海旅游一趟威沫;小李則是……”

??如果我們要決定明天從北京去上海開(kāi)幾趟車(chē),比如一趟車(chē)只能裝25人洼专。如果僅有信息1棒掠,我們做出的決策可能會(huì)是開(kāi)4趟;再得到信息2屁商,那么可能決策可能是開(kāi)2趟烟很;信息3、4可能會(huì)對(duì)這個(gè)決策有影響棒假,但是從經(jīng)驗(yàn)上來(lái)看溯职,似乎相對(duì)于信息1和2就沒(méi)有那么重要了;如果要制定出最優(yōu)的決策帽哑,那么需要所有N條信息谜酒。當(dāng)然,對(duì)于一個(gè)決策開(kāi)幾趟列車(chē)的人來(lái)說(shuō)妻枕,收集這么多信息成本太高了僻族,而且建模難度也太高了。

??如何以建模語(yǔ)言把需求的有效特征描述出來(lái)屡谐,更是一個(gè)難題述么。這當(dāng)中的難點(diǎn)在于,需求并不總是“100人”愕掏,“10:00"度秘,”500元“這樣簡(jiǎn)單,旅客選擇行為就是一個(gè)難于描述的需求維度饵撑。至少有兩種模型都在描述這一現(xiàn)象剑梳。

??離散選擇模型唆貌,以Logit模型為代表;

??用戶(hù)均衡模型垢乙,以Backmann模型為代表锨咙。

??這兩種理論或是結(jié)合或是獨(dú)立應(yīng)用,都取得了廣泛認(rèn)可追逮。這至少給了我一個(gè)啟示:對(duì)于需求的建模似乎并沒(méi)有正確酪刀,只要它能反映需求的主要特征且解釋能力足夠好,都是有應(yīng)用潛力的钮孵。

??如果追求與觀測(cè)結(jié)果更加接近的模型骂倘,那么放棄了一些解釋力模型也是有市場(chǎng)的,比如回歸模型巴席,人工神經(jīng)網(wǎng)絡(luò)等稠茂。但是放棄解釋力是有代價(jià)的,那就是在宏觀問(wèn)題中的應(yīng)用潛力收到影響情妖。

框架

??那么當(dāng)我拿到一篇新的論文時(shí),我應(yīng)該如何快速獲取其中有效信息呢诱担。首先當(dāng)然是快速先讀一遍毡证,嘗試回答下面問(wèn)題:

  • 問(wèn)題的背景和要素?(區(qū)分供給和需求)
  • 問(wèn)題屬于哪一類(lèi)模型蔫仙?

??第一個(gè)問(wèn)題只要認(rèn)真閱讀我相信是很好回答的料睛;而第二個(gè)問(wèn)題實(shí)際上就在考驗(yàn)讀者的積累了。如果你對(duì)論文的建模還比較模糊了話(huà)摇邦,不妨參考一下下表恤煞。

2.1.png
  • 雖然數(shù)據(jù)分析不在我理解問(wèn)題的框架當(dāng)中,但是通過(guò)數(shù)據(jù)得到需求建模的信息(比如市場(chǎng)的劃分等)是這個(gè)時(shí)代非呈┘基礎(chǔ)且重要的一種能力居扒。
  • 根據(jù)供需問(wèn)題的劃分,我對(duì)一些基礎(chǔ)理論進(jìn)行了分類(lèi)丑慎。圖中標(biāo)簽有中文有英文喜喂,取決于我第一次看到這個(gè)概念的時(shí)候它的語(yǔ)言。這些理論的背景都是來(lái)自于應(yīng)用數(shù)學(xué)

??這張表是我對(duì)目前我自己的知識(shí)框架的整理竿裂。如果我讀到一篇關(guān)于開(kāi)行方案的文章玉吁,它運(yùn)用雙層規(guī)劃模型,上層問(wèn)題是開(kāi)行方案的編制腻异,下層問(wèn)題是服務(wù)網(wǎng)絡(luò)配流进副,還涉及到了車(chē)底周轉(zhuǎn),那么這篇文章很快就能找到一個(gè)位置悔常。同樣影斑,如果你有某些地方不太懂也可以找到遺漏的知識(shí)點(diǎn)给赞。

??那怎樣才能整理出你自己的這一張表呢?

閱讀文獻(xiàn)

檢索文獻(xiàn)

??文獻(xiàn)檢索其實(shí)非常的重要鸥昏,因?yàn)榇蠹視r(shí)間有限塞俱,不可能精讀一個(gè)領(lǐng)域的所有文章。所以如何從一篇文章中提取盡可能多的信息(讀透)是非常重要的吏垮。我沒(méi)有比較好的方法蝙叛,但是還是有一個(gè)我認(rèn)為不錯(cuò)的方法:

  1. 如果你對(duì)研究領(lǐng)域一點(diǎn)認(rèn)識(shí)都沒(méi)有的話(huà)顽冶,建議去找找影響力高的期刊或者圖書(shū);

  2. 從這些期刊中選擇引用頻率比較高的論文;

  3. 閱讀這篇論文/這本書(shū)(的某個(gè)章節(jié))藏古,完善你的框架:

    了解論文的作者(們),如果不知道可以去ResearchGate和大學(xué)網(wǎng)站去找宪祥,

    了解論文的引用文獻(xiàn)臣缀,找到被引用次數(shù)高的期刊或者圖書(shū);

  4. 重復(fù)第3步痹换。

總結(jié)文獻(xiàn)

  • 文件檢索不等于找一篇看一篇征字,如果你看完一篇文章能夠拓展你的認(rèn)知,那么是很好的娇豫;如果一篇文章完全在你的認(rèn)知以?xún)?nèi)匙姜,那可以快速的瀏覽。
  • 高引的論文往往會(huì)向抽象的層次(基礎(chǔ)理論側(cè))更進(jìn)一步(提煉了問(wèn)題)或者是提出了一個(gè)很好的求解方法冯痢,這種文章請(qǐng)標(biāo)記為關(guān)鍵文章氮昧,有精讀的必要。
  • 請(qǐng)有效運(yùn)用文獻(xiàn)整理工具浦楣,如NoteExpress, EndNote等袖肥。

練習(xí)技能

??當(dāng)你開(kāi)始有了幾篇精讀的文獻(xiàn)之后,你就可以著手開(kāi)始自己的研究了振劳。不過(guò)椎组,如果你需要有所創(chuàng)新的話(huà),一些基本的技能還是要有所掌握的历恐。

數(shù)學(xué)基礎(chǔ)

??數(shù)學(xué)庐杨,尤其是應(yīng)用數(shù)學(xué)的分支,是框架中基礎(chǔ)理論的基礎(chǔ)夹供。在研究中灵份,你既需要數(shù)學(xué)語(yǔ)言來(lái)描述你的問(wèn)題,又需要一些解析/數(shù)值方法來(lái)求解你的問(wèn)題哮洽。一些基礎(chǔ)技能羅列如下填渠,包括一些關(guān)鍵點(diǎn)。

  • 運(yùn)籌學(xué)

    • 線性規(guī)劃理論

      大規(guī)模問(wèn)題: D-W分解,列生成方法原理

    • 非線性規(guī)劃理論

      拉格朗日乘子氛什,對(duì)偶理論莺葫,KKT條件

    • 凸規(guī)劃理論

      F-W算法,交替方向乘子法(ADMM)

    • 整數(shù)規(guī)劃理論

      B&B分支定界法

    • 動(dòng)態(tài)規(guī)劃理論

      Approximate Dynamic Programming (近似動(dòng)態(tài)規(guī)劃)

  • 數(shù)理統(tǒng)計(jì)學(xué)

    • 參數(shù)估計(jì)

      極大似然法 E-M法 機(jī)器學(xué)習(xí)的方法

    • 時(shí)間序列分析

      ARIMA (自回歸積分滑動(dòng)平均模型) 枪眉,DLM(動(dòng)態(tài)線性模型)等

計(jì)算機(jī)應(yīng)用

??我們的研究脫離不了計(jì)算機(jī)捺檬,在工作過(guò)程中,我主要用它來(lái)做三件事情:

  • 管理信息系統(tǒng)

    系統(tǒng)分析贸铜,建模堡纬,設(shè)計(jì)

  • 求解最優(yōu)化問(wèn)題

    調(diào)用求解器 Cplex Gurobi

  • 進(jìn)行數(shù)據(jù)分析

    • 文件系統(tǒng):SPSS 或者 R Python中的機(jī)器學(xué)習(xí)庫(kù)

    • 數(shù)據(jù)庫(kù):Oracle SQL

??給萌新的學(xué)習(xí)哪些語(yǔ)言(技術(shù))的推薦(層次由淺入深):

  • 如果你只是需要求解 matlab+yalmip
  • 如果你需要參與信息系統(tǒng)開(kāi)發(fā) C#
  • 如果你需要進(jìn)行數(shù)據(jù)分析 python / 簡(jiǎn)單統(tǒng)計(jì) SQL
  • 如果你需要發(fā)明“輪子” C++

團(tuán)隊(duì)協(xié)作

  • git


    1.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市蒿秦,隨后出現(xiàn)的幾起案子烤镐,更是在濱河造成了極大的恐慌,老刑警劉巖棍鳖,帶你破解...
    沈念sama閱讀 221,635評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件炮叶,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡渡处,警方通過(guò)查閱死者的電腦和手機(jī)镜悉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,543評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)医瘫,“玉大人积瞒,你說(shuō)我怎么就攤上這事〉窍拢” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,083評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵叮喳,是天一觀的道長(zhǎng)被芳。 經(jīng)常有香客問(wèn)我,道長(zhǎng)馍悟,這世上最難降的妖魔是什么畔濒? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,640評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮锣咒,結(jié)果婚禮上侵状,老公的妹妹穿的比我還像新娘。我一直安慰自己毅整,他們只是感情好趣兄,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,640評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著悼嫉,像睡著了一般艇潭。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,262評(píng)論 1 308
  • 那天蹋凝,我揣著相機(jī)與錄音鲁纠,去河邊找鬼。 笑死鳍寂,一個(gè)胖子當(dāng)著我的面吹牛改含,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播迄汛,決...
    沈念sama閱讀 40,833評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼捍壤,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了隔心?” 一聲冷哼從身側(cè)響起白群,我...
    開(kāi)封第一講書(shū)人閱讀 39,736評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎硬霍,沒(méi)想到半個(gè)月后帜慢,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,280評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡唯卖,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,369評(píng)論 3 340
  • 正文 我和宋清朗相戀三年粱玲,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片拜轨。...
    茶點(diǎn)故事閱讀 40,503評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡抽减,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出橄碾,到底是詐尸還是另有隱情卵沉,我是刑警寧澤,帶...
    沈念sama閱讀 36,185評(píng)論 5 350
  • 正文 年R本政府宣布法牲,位于F島的核電站史汗,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏拒垃。R本人自食惡果不足惜停撞,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,870評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望悼瓮。 院中可真熱鬧戈毒,春花似錦、人聲如沸横堡。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,340評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)命贴。三九已至恐疲,卻和暖如春腊满,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背培己。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,460評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工碳蛋, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人省咨。 一個(gè)月前我還...
    沈念sama閱讀 48,909評(píng)論 3 376
  • 正文 我出身青樓肃弟,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親零蓉。 傳聞我的和親對(duì)象是個(gè)殘疾皇子笤受,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,512評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容