創(chuàng)作初心
與2003年SARS相比问麸,我們的科技水平已經(jīng)有了較大的提高。通過科技技手段的運用钞翔,特別是充分挖掘手機信令的數(shù)據(jù)價值严卖,可以更有針對性地解決防控疫情問題。
從技術上角度上說布轿,利用手機信令數(shù)據(jù)完全可以對一個地區(qū)甚至更大空間范圍內(nèi)的人口流動哮笆,進行詳細地數(shù)據(jù)搜集来颤。近些年一些城市在舉辦大型活動、人口調(diào)查稠肘,旅游人口福铅,傳染病傳播流向與的分析上,都采用了以手機信令為核心數(shù)據(jù)源的分析和洞察项阴』基于手機信令的數(shù)據(jù)分析,為提高大型活動的安全治理环揽,人口空間的分布情況以及重點區(qū)域的管理都提供了重要的科學和數(shù)據(jù)保障
本方案基于脫敏的信令數(shù)據(jù)略荡,并以華南海鮮批發(fā)市場
為例,實現(xiàn)包括疫情傳染源的整體分析歉胶; 疑似人群活動區(qū)域識別汛兜;疫情態(tài)勢溯源與推演。
傳染源整體分析
隨著海鮮市場逐步停業(yè)整頓通今,自一月起流動人口有了明顯的下降序无,1月10日之后幾乎不再出現(xiàn)流動人口
華南海鮮批發(fā)市場
被認為初期新冠病毒進行二次傳播的高發(fā)區(qū)。我們基于信令數(shù)據(jù)衡创,對華南海鮮市場周邊的人口流動據(jù)做挖掘帝嗡;找出華南海鮮批發(fā)市場人流變化與新冠早起趨勢發(fā)展的潛在聯(lián)系。
如圖所示為十二月至一月底人口流動趨勢的按日統(tǒng)計圖璃氢,可以發(fā)現(xiàn)自一月份以來哟玷,隨著華南海鮮市場的關停和疫情的升溫,人流趨勢明顯下降一也。
我們將時間區(qū)間細化到小時巢寡,如圖所示為華南海鮮批發(fā)市場十二月至一月底每小時人員駐留行為變動情況;工作日的人流波動高峰出現(xiàn)在上午11點前后與晚上19點前后(近午餐椰苟、晚餐)抑月。而周末總體趨勢比較平緩
同時我們將相關華南海鮮市場相關新聞標注到了坐標軸上,可以更方便看到”黑天鵝“”對華南海鮮市場人流趨勢的營銷舆蝴。 自12月15日起谦絮,開始陸續(xù)出現(xiàn)發(fā)生有華南海鮮市場接觸史的患者, 而自1月起洁仗,海鮮市場逐步停業(yè)整頓层皱,流動人口有了明顯的下降
華南海鮮市場傳播趨勢溯源
我們基于重構的Word2Vec&Doc2Vec實現(xiàn)了華南海鮮周邊用戶移動模式挖掘,發(fā)現(xiàn)華南海鮮批發(fā)市場80%以上的人群赠潦,都來自于5公里范圍內(nèi)的區(qū)域叫胖,我們建議對5公里內(nèi)地區(qū)的范圍做重點排查,對超過5公里的特定區(qū)域做選擇性排查
在探索了華南海鮮市場整體趨勢變化的基礎上她奥,我們希望實現(xiàn)流入華南海鮮市場的用戶群識別體瓮增,為新冠溯源提供數(shù)據(jù)基礎怎棱。
軌跡移動模式挖掘
下面,我們將以挖掘武漢市民的移動模式為基礎绷跑,實現(xiàn)對遷入與遷出華南海鮮市場群體的識別拳恋;我們通過對武漢市手機用戶途徑基站的時間序列數(shù)據(jù), 以及每個基站的地理坐標信息編碼,形成用戶軌跡編碼你踩;同時原數(shù)據(jù)中的時間帶有時分秒等信息, 為了保證每個位置具有較高的出現(xiàn)頻率, 將時間信息聚合至每個小時整點诅岩。格式如下:
{ }
w為脫敏的用戶標識讳苦,s為位置信息带膜,t為每個小時點≡眨基于Word2Vec 模型進行訓練[1], 將得到每條位置點的向量化標識與相似度膝藕;基于Doc2vec對用戶軌跡整體編碼訓練后,將得到用戶軌跡間的相似度咐扭。整體方案如下圖所示:
其中芭挽,我們采用用cosine距離來計算坐標與坐標,軌跡與軌跡的相似度:
如圖所示為Word2Vec/Doc2Vec 模型進行訓練后用tensorborad對時空向量與軌跡向量的投影層(Projection Layer)做投射蝗肪,如下圖所示:
為更好進行時間與空間的推演袜爪,我們對經(jīng)典的Word2vec和Doc2vec進行了重構,
在傳統(tǒng)的Word2vec模型中薛闪,把每個時空點當做為類別標簽辛馆,丟失了其數(shù)值的屬性和信息。我們希望在Word2vec訓練模型時豁延,加入時間與空間的數(shù)值判斷和比較昙篙,方便我們做時間與空間的推演[2]
我們只選取大于一定范圍的時空坐標點放到滑動窗口中構建訓練訓練集,訓練結束后诱咏,逐一將每個時空向量的相似度在top5的范圍內(nèi)的時空坐標點相連接苔可,并投射至武漢地圖平面,如下圖所示:
傳播溯源
接下來袋狞,我們分別按照空間與時間推演的方式焚辅,來看華南海鮮周邊的用戶流入情況,為新冠早期的傳播溯源提供支持苟鸯。
我們 將華南海鮮批發(fā)市場
作為終點法焰,來看之前的一段時間內(nèi)遷入情況,嘗試發(fā)現(xiàn)新冠病毒最有可能是在哪些位置被帶入華南海鮮批發(fā)市場
的倔毙,如圖所示內(nèi)圈為1公里范圍埃仪,外圈為5公里范圍:
我們發(fā)現(xiàn)華南海鮮批發(fā)市場
80%以上的人群,都來自于5公里范圍內(nèi)的區(qū)域——因此我們建議對5公里內(nèi)地區(qū)的范圍做重點排查陕赃,對超過5公里的特定區(qū)域做選擇性排查卵蛉。
傳播推演
基于上文提到對武漢市民移動模式挖掘的基礎上颁股,我們希望按照時間與空間的維度,挖掘出在華南海鮮市場發(fā)生過密切接觸后的用戶之后的去向傻丝,并從而對這些區(qū)域做重點防控
空間推演
空間維度上甘有,漢口火車站,范湖地鐵站葡缰,萬達廣場等都是華南海鮮市場人流遷徙的重點目標亏掀,省內(nèi)的孝感,黃岡泛释,黃石等滤愕,省際貴陽,洛陽怜校,杭溆埃口,南京都是華南海鮮市場人群流向的重點城市茄茁。
我們將觀察人群的流出情況魂贬,與華南海鮮市場存在高度相似的時空坐標點如下圖所示,華南海鮮市場的西南方向包括道路和漢口火車站裙顽,因此付燥,時空坐標點的方向的趨勢更加明顯。
我們限定與華南海鮮市場的距離超過300米愈犹,且具備強相關的位置键科,并標識poi信息,如圖所示:
漢口火車站甘萧,范湖地鐵站萝嘁,萬達廣場等都是華南海鮮市場人流遷徙的重點目標。
我們接下來預測最有可能從華南海鮮市場出發(fā)扬卷,去往其他城市的軌跡牙言,如圖所示為與華南海鮮市場具備較強相關度的外部省市, 省內(nèi)包括孝感怪得,黃岡咱枉,黃石等,省際包括貴陽徒恋,洛陽蚕断,海口入挣,南京 亿乳。
時間推演
時間維度上,大部分在華南海鮮市場周邊人群將在4-12小時之內(nèi)離開并擴散;而武漢市內(nèi)的武昌區(qū)葛假,洪山區(qū)障陶,江夏區(qū)等位于長江以南的位置,在12個小時內(nèi)受影響相對較辛难怠抱究;新冠攜帶者極有可能在12小時之內(nèi)擴散到武漢市外的其他省市區(qū)域,
下面我們忽略空間維度带斑,來觀測隨著時間t的推移鼓寺,與華南海鮮市場具備較強時空相似度的區(qū)域s的強度及分布變化情況。如圖所示為12個小時內(nèi)時空點相關度變化勋磕,區(qū)域顏色越深標識相關度越強:
可以看到隨時間的推移妈候,華南海鮮市場周邊區(qū)域的相似度逐步變?nèi)酢蟛糠衷谌A南海鮮市場主要的用戶群在4-12小時之內(nèi)離開并擴散
如圖所示為12個小時內(nèi),時空點相關范圍的變化:
可以看出隨時間推移朋凉,高相似度區(qū)域逐步擴散州丹,特別是臨近的機場醋安,高速武漢周邊衛(wèi)星城逐步出現(xiàn)高相似度時空坐標杂彭。由此可見,武漢市內(nèi)的武昌區(qū)吓揪,洪山區(qū)亲怠,江夏區(qū)等位于長江以南的位置,在12個小時內(nèi)受影響相對較小柠辞;而在海鮮市場的被感染的新冠攜帶者極有可能在12小時之內(nèi)擴散到武漢市外的其他省市區(qū)域
防控應用
除華南海鮮市場外团秽,我們也在結合衛(wèi)健委公開的確診、疑似病例數(shù)據(jù)叭首,計算出這些用戶的移動模式习勤,傳播趨勢。同時分析風險值較高區(qū)域焙格,實現(xiàn)對城市图毕、縣域、街道眷唉、社區(qū)的風險預警予颤,如圖所示為我們以某個小區(qū)為例,通過對該位置用戶移動的模式計算得到人口密度與人口流動情況:
進一步我們還可以基于該位置用戶移動的模式冬阳,提供該小區(qū)的復工狀況蛤虐,人均在外時長等信息:
此外,我們也在通過信令數(shù)大據(jù)面向公眾用戶提供健康碼服務肝陪, 密切接觸者查詢驳庭;向政府部委提供行業(yè)復工指數(shù)等服務。在解決用戶實際需求的同時氯窍,為政府部委提供科學精準的數(shù)據(jù)支撐和分析服務饲常。后續(xù)我們將加持續(xù)信令大數(shù)據(jù)能力建設捏检,進一步發(fā)揮信令大數(shù)據(jù)在疫情防控的價值。
-
location2vec
: a situation-aware representation for visual exploration of urban locations. ?