??本文是我在2017年9月團(tuán)隊(duì)Workshop上所講內(nèi)容的底稿恨旱。為方便各位同學(xué)學(xué)習(xí)交流念搬,發(fā)布于此瓷产。
寫(xiě)此文的動(dòng)機(jī)
??曾幾何時(shí),我也是一只剛進(jìn)入科研的小萌新按摘。剛?cè)腴T(mén)的時(shí)候有著一腔熱情包券,但是每每閱讀文獻(xiàn),尤其是高水平的文獻(xiàn)的時(shí)候炫贤,總免不了產(chǎn)生一種知難而退之感溅固。究其原因,主要來(lái)自于兩方面:
英語(yǔ)水平不過(guò)關(guān)照激,專(zhuān)業(yè)詞匯需要反復(fù)查发魄。
基礎(chǔ)知識(shí)點(diǎn)不足,常常出現(xiàn)大坑需要填俩垃。
??這兩方面因素使得閱讀文獻(xiàn)花費(fèi)了巨大的時(shí)間成本励幼。如果要重復(fù)文獻(xiàn)中的方法或是案例,那么花費(fèi)的時(shí)間會(huì)更多(因?yàn)閹缀趺恳痪湓?huà)都要反復(fù)地讀)口柳。
??第一點(diǎn)好彌補(bǔ)苹粟,很多詞見(jiàn)得次數(shù)多了自然就熟了。第二點(diǎn)就難了跃闹,即使是同樣的一種技術(shù)/一個(gè)模型/一種方法嵌削,不同的文章中運(yùn)用的方式也會(huì)大相徑庭毛好,而且,作為以應(yīng)用為導(dǎo)向的會(huì)議或者期刊論文來(lái)說(shuō)苛秕,沒(méi)有必要把方法論完整的敘述一遍肌访。也就是說(shuō),這一點(diǎn)并不是多讀論文就能彌補(bǔ)的艇劫。
??那么吼驶,如何有效的解決這個(gè)問(wèn)題呢?幾年后的今天回過(guò)頭來(lái)看這個(gè)問(wèn)題店煞,發(fā)現(xiàn)自己走了非常多的彎路蟹演,但也有幸走出了這種困境。雖然無(wú)法一時(shí)間將所有的知識(shí)傾囊相授顷蟀,但是我想通過(guò)此文提出一個(gè)理解我們所研究問(wèn)題的一個(gè)基本的框架酒请。我希望通過(guò)運(yùn)用這套方法能夠?qū)ψx者有所幫助。
當(dāng)你開(kāi)始閱讀一篇本專(zhuān)業(yè)的新論文鸣个,你可以迅速地給它在研究領(lǐng)域內(nèi)的位置羞反;
通過(guò)知識(shí)整理,你可以知道你要從哪些地方開(kāi)始你的研究工作毛萌。
理解交通規(guī)劃與管理問(wèn)題
出發(fā)點(diǎn)
??我的專(zhuān)業(yè)是交通運(yùn)輸規(guī)劃與管理苟弛,這是一個(gè)涉及面非常廣的學(xué)科,其研究的內(nèi)容從研究對(duì)象上來(lái)說(shuō)阁将,包括城市道路道路交通膏秫,城市軌道交通,鐵路運(yùn)輸做盅,航空運(yùn)輸?shù)如拖鳎粡臅r(shí)間范圍上來(lái)說(shuō),涵蓋從規(guī)劃問(wèn)題(如動(dòng)車(chē)段所選址)到運(yùn)營(yíng)控制(如列車(chē)調(diào)度)吹榴。在研究當(dāng)中往往會(huì)讀到非常多的論文亭敢,其研究的問(wèn)題,問(wèn)題的表達(dá)和解決問(wèn)題的方法多種多樣图筹。如何快速的理解論文描述的問(wèn)題呢帅刀?我以供求關(guān)系為理解問(wèn)題的出發(fā)點(diǎn)。
??“供”是指供給远剩,在鐵路運(yùn)輸中扣溺,列車(chē)上的每一個(gè)席位就是供給的一種形式;“需”是指客運(yùn)需求瓜晤,這是一個(gè)抽象的概念锥余。產(chǎn)生需求的主體是人,比如“我想明天從北京去上毫÷樱”表達(dá)了我的一種需求驱犹。交通規(guī)劃與管理的問(wèn)題背景都可以看做是供需關(guān)系在不同維度上的體現(xiàn)嘲恍。
供給——管理優(yōu)化
??在研究的問(wèn)題中,供給往往會(huì)受到非常多的約束雄驹。最基本的約束來(lái)自于時(shí)空的約束佃牛,比如,一條鐵路線上不能無(wú)限制的開(kāi)車(chē)医舆,因?yàn)橐WC安全吁脱;動(dòng)車(chē)組不能無(wú)休止的運(yùn)行,因?yàn)橐S修彬向;在內(nèi)陸火車(chē)上吃不到海鮮,因?yàn)檫\(yùn)過(guò)來(lái)時(shí)間不夠(過(guò)保質(zhì)期)攻冷;列車(chē)不能無(wú)限制的賣(mài)票娃胆,因?yàn)檐?chē)上席位有限。
??解決上述的問(wèn)題等曼,除了引入新的資源以外(更高時(shí)速的列車(chē)里烦,調(diào)整修程修制,換用席位更多的車(chē)型)外禁谦,更多的情況是有效的對(duì)現(xiàn)有資源進(jìn)行有效組織胁黑。在這里我把這些手段統(tǒng)一稱(chēng)作“優(yōu)化管理”。通常州泊,解決這一類(lèi)問(wèn)題的手段是通過(guò)更好的計(jì)劃或者是控制丧蘸。我先簡(jiǎn)單區(qū)分一下這兩者的區(qū)別。
??計(jì)劃:在何時(shí)何地進(jìn)行何種操作遥皂。如力喷,“11時(shí)30分XXX次列車(chē)從北京南站發(fā)車(chē)”,“10時(shí)-11時(shí)發(fā)出這種方案線的列車(chē)頻率為5”演训。
??控制:根據(jù)當(dāng)前的狀況調(diào)整/制定計(jì)劃弟孟。如,“當(dāng)XXX次列車(chē)晚點(diǎn)样悟,運(yùn)行圖進(jìn)行……調(diào)整”拂募。
??根據(jù)優(yōu)化目標(biāo)的不同,模型的構(gòu)建會(huì)基于Scheduling或Optimal Control兩類(lèi)理論框架窟她。當(dāng)然陈症,不同論文里面因?yàn)槊枋龅膯?wèn)題不同,所構(gòu)建的具體模型不同礁苗,但基本都符合這兩類(lèi)框架爬凑。
需求——現(xiàn)象描述
??在供給對(duì)面的是形態(tài)各異的需求。需求中可以包含的信息是非常多的试伙。我們不可能在解決所有的問(wèn)題中都把所有關(guān)于需求的信息都用上嘁信,因?yàn)檫@是不必要且難于操作的于样。因而針對(duì)不同的問(wèn)題(管理優(yōu)化的目標(biāo))我們選取哪些信息,以及如何準(zhǔn)確地把需求描述出來(lái)是最關(guān)鍵問(wèn)題潘靖。
??對(duì)需求的描述從最宏觀到最微觀的一個(gè)例子穿剖。
信息1:“有100人明天想從北京去上海∝砸纾”
信息2:“50個(gè)人更傾向于火車(chē)出行糊余,50人想要坐飛機(jī)〉ゼ牛”
信息3:“傾向于火車(chē)出行的旅客傾向于坐上午10:00的火車(chē)贬芥。”
信息4:“如果火車(chē)票漲價(jià)500元宣决,有20個(gè)人改乘坐飛機(jī)蘸劈。”
……
信息N:“小明明天上午10點(diǎn)在上海有個(gè)會(huì)議尊沸;小王希望最近幾天去上海旅游一趟威沫;小李則是……”
??如果我們要決定明天從北京去上海開(kāi)幾趟車(chē),比如一趟車(chē)只能裝25人洼专。如果僅有信息1棒掠,我們做出的決策可能會(huì)是開(kāi)4趟;再得到信息2屁商,那么可能決策可能是開(kāi)2趟烟很;信息3、4可能會(huì)對(duì)這個(gè)決策有影響棒假,但是從經(jīng)驗(yàn)上來(lái)看溯职,似乎相對(duì)于信息1和2就沒(méi)有那么重要了;如果要制定出最優(yōu)的決策帽哑,那么需要所有N條信息谜酒。當(dāng)然,對(duì)于一個(gè)決策開(kāi)幾趟列車(chē)的人來(lái)說(shuō)妻枕,收集這么多信息成本太高了僻族,而且建模難度也太高了。
??如何以建模語(yǔ)言把需求的有效特征描述出來(lái)屡谐,更是一個(gè)難題述么。這當(dāng)中的難點(diǎn)在于,需求并不總是“100人”愕掏,“10:00"度秘,”500元“這樣簡(jiǎn)單,旅客選擇行為就是一個(gè)難于描述的需求維度饵撑。至少有兩種模型都在描述這一現(xiàn)象剑梳。
??離散選擇模型唆貌,以Logit模型為代表;
??用戶(hù)均衡模型垢乙,以Backmann模型為代表锨咙。
??這兩種理論或是結(jié)合或是獨(dú)立應(yīng)用,都取得了廣泛認(rèn)可追逮。這至少給了我一個(gè)啟示:對(duì)于需求的建模似乎并沒(méi)有正確酪刀,只要它能反映需求的主要特征且解釋能力足夠好,都是有應(yīng)用潛力的钮孵。
??如果追求與觀測(cè)結(jié)果更加接近的模型骂倘,那么放棄了一些解釋力模型也是有市場(chǎng)的,比如回歸模型巴席,人工神經(jīng)網(wǎng)絡(luò)等稠茂。但是放棄解釋力是有代價(jià)的,那就是在宏觀問(wèn)題中的應(yīng)用潛力收到影響情妖。
框架
??那么當(dāng)我拿到一篇新的論文時(shí),我應(yīng)該如何快速獲取其中有效信息呢诱担。首先當(dāng)然是快速先讀一遍毡证,嘗試回答下面問(wèn)題:
- 問(wèn)題的背景和要素?(區(qū)分供給和需求)
- 問(wèn)題屬于哪一類(lèi)模型蔫仙?
??第一個(gè)問(wèn)題只要認(rèn)真閱讀我相信是很好回答的料睛;而第二個(gè)問(wèn)題實(shí)際上就在考驗(yàn)讀者的積累了。如果你對(duì)論文的建模還比較模糊了話(huà)摇邦,不妨參考一下下表恤煞。
- 雖然數(shù)據(jù)分析不在我理解問(wèn)題的框架當(dāng)中,但是通過(guò)數(shù)據(jù)得到需求建模的信息(比如市場(chǎng)的劃分等)是這個(gè)時(shí)代非呈┘基礎(chǔ)且重要的一種能力居扒。
- 根據(jù)供需問(wèn)題的劃分,我對(duì)一些基礎(chǔ)理論進(jìn)行了分類(lèi)丑慎。圖中標(biāo)簽有中文有英文喜喂,取決于我第一次看到這個(gè)概念的時(shí)候它的語(yǔ)言。這些理論的背景都是來(lái)自于應(yīng)用數(shù)學(xué)
??這張表是我對(duì)目前我自己的知識(shí)框架的整理竿裂。如果我讀到一篇關(guān)于開(kāi)行方案的文章玉吁,它運(yùn)用雙層規(guī)劃模型,上層問(wèn)題是開(kāi)行方案的編制腻异,下層問(wèn)題是服務(wù)網(wǎng)絡(luò)配流进副,還涉及到了車(chē)底周轉(zhuǎn),那么這篇文章很快就能找到一個(gè)位置悔常。同樣影斑,如果你有某些地方不太懂也可以找到遺漏的知識(shí)點(diǎn)给赞。
??那怎樣才能整理出你自己的這一張表呢?
閱讀文獻(xiàn)
檢索文獻(xiàn)
??文獻(xiàn)檢索其實(shí)非常的重要鸥昏,因?yàn)榇蠹視r(shí)間有限塞俱,不可能精讀一個(gè)領(lǐng)域的所有文章。所以如何從一篇文章中提取盡可能多的信息(讀透)是非常重要的吏垮。我沒(méi)有比較好的方法蝙叛,但是還是有一個(gè)我認(rèn)為不錯(cuò)的方法:
如果你對(duì)研究領(lǐng)域一點(diǎn)認(rèn)識(shí)都沒(méi)有的話(huà)顽冶,建議去找找影響力高的期刊或者圖書(shū);
從這些期刊中選擇引用頻率比較高的論文;
-
閱讀這篇論文/這本書(shū)(的某個(gè)章節(jié))藏古,完善你的框架:
了解論文的作者(們),如果不知道可以去ResearchGate和大學(xué)網(wǎng)站去找宪祥,
了解論文的引用文獻(xiàn)臣缀,找到被引用次數(shù)高的期刊或者圖書(shū);
重復(fù)第3步痹换。
總結(jié)文獻(xiàn)
- 文件檢索不等于找一篇看一篇征字,如果你看完一篇文章能夠拓展你的認(rèn)知,那么是很好的娇豫;如果一篇文章完全在你的認(rèn)知以?xún)?nèi)匙姜,那可以快速的瀏覽。
- 高引的論文往往會(huì)向抽象的層次(基礎(chǔ)理論側(cè))更進(jìn)一步(提煉了問(wèn)題)或者是提出了一個(gè)很好的求解方法冯痢,這種文章請(qǐng)標(biāo)記為關(guān)鍵文章氮昧,有精讀的必要。
- 請(qǐng)有效運(yùn)用文獻(xiàn)整理工具浦楣,如NoteExpress, EndNote等袖肥。
練習(xí)技能
??當(dāng)你開(kāi)始有了幾篇精讀的文獻(xiàn)之后,你就可以著手開(kāi)始自己的研究了振劳。不過(guò)椎组,如果你需要有所創(chuàng)新的話(huà),一些基本的技能還是要有所掌握的历恐。
數(shù)學(xué)基礎(chǔ)
??數(shù)學(xué)庐杨,尤其是應(yīng)用數(shù)學(xué)的分支,是框架中基礎(chǔ)理論的基礎(chǔ)夹供。在研究中灵份,你既需要數(shù)學(xué)語(yǔ)言來(lái)描述你的問(wèn)題,又需要一些解析/數(shù)值方法來(lái)求解你的問(wèn)題哮洽。一些基礎(chǔ)技能羅列如下填渠,包括一些關(guān)鍵點(diǎn)。
-
運(yùn)籌學(xué)
-
線性規(guī)劃理論
大規(guī)模問(wèn)題: D-W分解,列生成方法原理
-
非線性規(guī)劃理論
拉格朗日乘子氛什,對(duì)偶理論莺葫,KKT條件
-
凸規(guī)劃理論
F-W算法,交替方向乘子法(ADMM)
-
整數(shù)規(guī)劃理論
B&B分支定界法
-
動(dòng)態(tài)規(guī)劃理論
Approximate Dynamic Programming (近似動(dòng)態(tài)規(guī)劃)
-
-
數(shù)理統(tǒng)計(jì)學(xué)
-
參數(shù)估計(jì)
極大似然法 E-M法 機(jī)器學(xué)習(xí)的方法
-
時(shí)間序列分析
ARIMA (自回歸積分滑動(dòng)平均模型) 枪眉,DLM(動(dòng)態(tài)線性模型)等
-
計(jì)算機(jī)應(yīng)用
??我們的研究脫離不了計(jì)算機(jī)捺檬,在工作過(guò)程中,我主要用它來(lái)做三件事情:
-
管理信息系統(tǒng)
系統(tǒng)分析贸铜,建模堡纬,設(shè)計(jì)
-
求解最優(yōu)化問(wèn)題
調(diào)用求解器 Cplex Gurobi
-
進(jìn)行數(shù)據(jù)分析
文件系統(tǒng):SPSS 或者 R Python中的機(jī)器學(xué)習(xí)庫(kù)
數(shù)據(jù)庫(kù):Oracle SQL
??給萌新的學(xué)習(xí)哪些語(yǔ)言(技術(shù))的推薦(層次由淺入深):
- 如果你只是需要求解 matlab+yalmip
- 如果你需要參與信息系統(tǒng)開(kāi)發(fā) C#
- 如果你需要進(jìn)行數(shù)據(jù)分析 python / 簡(jiǎn)單統(tǒng)計(jì) SQL
- 如果你需要發(fā)明“輪子” C++
團(tuán)隊(duì)協(xié)作
-
git
1.png