航空業(yè)每時(shí)每刻都要處理大量的數(shù)據(jù),是一個(gè)很好的可以利用大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù)創(chuàng)造價(jià)值的領(lǐng)域午衰,在航行數(shù)據(jù)嘿辟、天氣數(shù)據(jù)、顧客行為數(shù)據(jù)等多個(gè)角度和層次都可以進(jìn)行挖掘池摧。本文將選取航行燃油預(yù)測這個(gè)角度入手簡要介紹大數(shù)據(jù)分析在航空領(lǐng)域的實(shí)踐焦除,是對項(xiàng)目流程和通用方法的總結(jié),并不涉及到具體的業(yè)務(wù)邏輯和算法實(shí)現(xiàn)作彤。
業(yè)務(wù)和技術(shù)的雙重驅(qū)動
飛機(jī)的航行燃油一直占據(jù)著航空業(yè)成本的很大比例膘魄,13年左右是國際油價(jià)高漲時(shí)期乌逐,燃油費(fèi)用最高可以達(dá)到總成本的50%,目前油價(jià)下跌瓣距,情況有所好轉(zhuǎn)黔帕,但是仍然占據(jù)至少15%。
航行燃油可以簡單地劃分為決策性燃油和非決策性燃油蹈丸,決策性燃油是指部分燃油的分配由機(jī)組人員人為決策成黄。
由于決策性燃油的經(jīng)驗(yàn)的成分很大,這個(gè)過程必然導(dǎo)致油量的不確定性逻杖,多帶燃油會增加油耗奋岁,因?yàn)槎鄮У挠鸵紦?jù)重量從而消耗油量,即導(dǎo)致所謂的攜帶消耗成本荸百。有關(guān)數(shù)據(jù)顯示闻伶,空客A321攜帶7噸燃油時(shí),攜帶消耗成本已經(jīng)達(dá)到20%左右够话。航空公司每年因過量攜帶燃油會產(chǎn)生數(shù)百萬美元的開支蓝翰。但是少帶燃油則有可能產(chǎn)生安全問題,關(guān)乎乘客的生命和財(cái)產(chǎn)安全女嘲。所以畜份,燃油攜帶量要能達(dá)到攜帶消耗成本和用油安全的平衡,這對于人為決策來講欣尼,顯然是一個(gè)很大的挑戰(zhàn)爆雹。
另一方面,從技術(shù)角度來講愕鼓,現(xiàn)在大數(shù)據(jù)時(shí)代來了钙态,數(shù)據(jù)的存儲和管理成本越來越高,但是一直沒有去充分使用菇晃,那么說這本身就是一種浪費(fèi)册倒,如何充分挖掘這些數(shù)據(jù)來創(chuàng)造價(jià)值,實(shí)現(xiàn)從人為決策到數(shù)據(jù)驅(qū)動到一個(gè)轉(zhuǎn)變磺送,燃油預(yù)測是一個(gè)很好的切入點(diǎn)剩失。
燃油的預(yù)測和推薦
在進(jìn)行燃油的預(yù)測和推薦時(shí),我們會面臨如下問題:
-
哪些燃油可以被優(yōu)化
由于各個(gè)航空公司的燃油控制策略是不一樣的册着,在滑行、爬升脾歧、交通空中管制等階段的決策性燃油是不統(tǒng)一的甲捏,這需要根據(jù)其具體的策略和歷史燃油數(shù)據(jù)來分析哪些燃油可以被優(yōu)化,對于一些歷史燃油數(shù)據(jù)較少的航空公司鞭执,則還要進(jìn)行一段時(shí)間的數(shù)據(jù)采集才能做出決定司顿。
如何與已有系統(tǒng)集成
一般來說芒粹,航空公司已經(jīng)搭建好了自己的航班管理或者燃油管理系統(tǒng),燃油推薦系統(tǒng)的輸入數(shù)據(jù)來自于已有系統(tǒng)大溜,譬如航班飛行數(shù)據(jù)化漆、航班實(shí)際燃油數(shù)據(jù)等,的而輸出數(shù)據(jù)要被燃油管理系統(tǒng)調(diào)用钦奋,然后加油員才可以獲取到推薦的燃油座云。與已有系統(tǒng)集成時(shí)要保障服務(wù)的高可用性。-
如何建模
建模通常是要利用機(jī)器學(xué)習(xí)算法建立起燃油數(shù)據(jù)和其他因素之間的關(guān)系付材,即其他因素是因變量朦拖,需要預(yù)測的燃油數(shù)據(jù)是目的變量:
建模階段需要行業(yè)專家、數(shù)據(jù)科學(xué)家和軟件架構(gòu)師等角色的共同參與厌衔,要完成算法和技術(shù)的選型璧帝,模型的訓(xùn)練和優(yōu)化調(diào)整要經(jīng)歷數(shù)據(jù)收集->數(shù)據(jù)建模->結(jié)果預(yù)測
多次循環(huán)的過程。
系統(tǒng)框架分析
數(shù)據(jù)收集富寿、數(shù)據(jù)建模和結(jié)果預(yù)測三階段的系統(tǒng)框架:
在數(shù)據(jù)采集階段睬隶,初次建模的歷史數(shù)據(jù)是需要ETL工具導(dǎo)入的,存入關(guān)系型數(shù)據(jù)庫或分布式文件系統(tǒng)可便于離線分析和建模页徐,而系統(tǒng)開始運(yùn)行之后苏潜,則可以將新的實(shí)時(shí)數(shù)據(jù)源源不斷地寫入數(shù)據(jù)庫,從而可以周期性地進(jìn)行重新訓(xùn)練模型泞坦,構(gòu)成了自學(xué)習(xí)的閉環(huán)窖贤。
燃油預(yù)測系統(tǒng)與已有系統(tǒng)集成: