智慧城市相關(guān)的計(jì)算問題挎挖,是最近國內(nèi)外研究的熱點(diǎn)寞焙。根據(jù)最近查閱的一些資料误阻,對(duì)當(dāng)前存在的一些難點(diǎn)做了梳理行拢,主要參考了京東金融鄭宇老師的PPT及論文資料。
數(shù)據(jù)稀疏性
如果用稀疏的數(shù)據(jù)求到全局的數(shù)據(jù)痕囱,與采樣的問題類似田轧。與采樣問題不一樣的是。例:如果只有Facebook用戶的位置數(shù)據(jù)咐蝇,如何反求城市人群的空間移動(dòng)行為涯鲁?空氣質(zhì)量的監(jiān)測點(diǎn)數(shù)量有限,如何用有限的點(diǎn)空氣質(zhì)量數(shù)據(jù)有序,感知其他區(qū)域的空氣質(zhì)量抹腿?除了常見的線性插值的方法,是否還有其他方法呢旭寿?
數(shù)據(jù)丟失
在數(shù)據(jù)稀疏的基礎(chǔ)上警绩,如果因?yàn)閭鞲衅鞯脑O(shè)備故障導(dǎo)致的數(shù)據(jù)丟失問題。例:空氣質(zhì)量檢測點(diǎn)異常盅称,導(dǎo)致某些時(shí)段的數(shù)據(jù)丟失肩祥。補(bǔ)全數(shù)據(jù)的工作是非常有意義的,因?yàn)楫?dāng)前機(jī)器學(xué)習(xí)的算法需要大量的時(shí)序完整數(shù)據(jù)缩膝,如果數(shù)據(jù)有丟失混狠,預(yù)測的準(zhǔn)確性會(huì)有問題。此外疾层,如果數(shù)據(jù)可以補(bǔ)全将饺,也便于數(shù)據(jù)的可視化呈現(xiàn)及檢索。如果出現(xiàn)了缺失,是用空間臨近的數(shù)據(jù)補(bǔ)全還是用時(shí)間臨近的數(shù)據(jù)補(bǔ)全予弧?IJCAI2016的一篇論文提出了一些解決方案:ST-MVL: Filling Missing Values in Geo-Sensory Time Series Data刮吧。是否還存在其他的方法來做數(shù)據(jù)補(bǔ)全?
最優(yōu)化資源分配
雖然IoT的越來越火熱掖蛤,各個(gè)城市建設(shè)的差距依然存在杀捻,如果用有限的資源獲得最大的收益,是智慧城市計(jì)算中的一個(gè)非常有意義的研究問題蚓庭。例:摩拜單車如何投放致讥、在城市中如何放置充電樁、如何放置空氣質(zhì)量監(jiān)測設(shè)備彪置、在高速公路那些路途投放應(yīng)急拖車拄踪。這些都是NP難的問題。而且這些問題往往都是開放式的拳魁,沒有Ground Truth。
最后
人機(jī)學(xué)習(xí)是當(dāng)前研究的熱點(diǎn)撮弧。類似為專家設(shè)計(jì)的可視分析工作潘懊。提出機(jī)器學(xué)習(xí)算法的人,往往不是某個(gè)行業(yè)領(lǐng)域的專家贿衍,所設(shè)計(jì)的算法難免與實(shí)際的應(yīng)用場景不符授舟。如果能為領(lǐng)域?qū)<姨峁┙换ナ降墓ぞ撸鶕?jù)專家的反饋贸辈,立馬得出改進(jìn)的算法結(jié)果释树,將有助于解決實(shí)際的問題。