?前言
作為社會(huì)的主體黔姜,人口是影響社會(huì)發(fā)展的基本力量拢切,人口規(guī)模的變化是決定城市空間規(guī)模的重要影響因素。我國(guó)正處在城市高速發(fā)展時(shí)期秆吵,城市規(guī)劃的重要性日益凸顯淮椰,人口的量化分析占有越發(fā)重要的地位。
城市人口數(shù)量每時(shí)每刻都在變化,自身增長(zhǎng)規(guī)律十分復(fù)雜主穗。目前泻拦,人口統(tǒng)計(jì)方法基本分為靜態(tài)統(tǒng)計(jì)和動(dòng)態(tài)統(tǒng)計(jì)兩種。靜態(tài)統(tǒng)計(jì)一般廣泛應(yīng)用于統(tǒng)計(jì)局忽媒、公安局等部門(mén)争拐,以普查、抽查晦雨、登記等傳統(tǒng)手段為主架曹,有耗時(shí)高、成本大闹瞧、效率低等特點(diǎn)绑雄。
近幾年,隨著大數(shù)據(jù)和數(shù)據(jù)科學(xué)的興起,基于信令、手機(jī)APP题涨、GIS應(yīng)用的移動(dòng)位置大數(shù)據(jù)動(dòng)態(tài)人口統(tǒng)計(jì)方法正在迅速發(fā)展霜定,補(bǔ)充了傳統(tǒng)人口統(tǒng)計(jì)數(shù)據(jù)來(lái)源,可以作為動(dòng)態(tài)人口統(tǒng)計(jì)結(jié)果的參考標(biāo)準(zhǔn)。
基于移動(dòng)數(shù)據(jù)的動(dòng)態(tài)人口統(tǒng)計(jì)
TalkingData覆蓋數(shù)據(jù)具有來(lái)源豐富、種類(lèi)齊全、數(shù)據(jù)體量大等特點(diǎn)珊楼。目前,TalkingData除了自有移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)度液,還整合了運(yùn)營(yíng)商等合作伙伴的數(shù)據(jù)厕宗,包含GPS、基站堕担、WiFi等位置信息已慢。
下圖以計(jì)算年度數(shù)據(jù)為例,介紹TalkingData動(dòng)態(tài)人口統(tǒng)計(jì)的主體邏輯:
TalkingData人口統(tǒng)計(jì)團(tuán)隊(duì)提取一年內(nèi)的所有移動(dòng)設(shè)備數(shù)據(jù)霹购,基于用戶(hù)群體出現(xiàn)天數(shù)佑惠、駐留時(shí)長(zhǎng)、時(shí)間間隔維度建立評(píng)估模型齐疙,同時(shí)根據(jù)靜態(tài)統(tǒng)計(jì)結(jié)果膜楷,建立了判定穩(wěn)定用戶(hù)的閾值≌攴埽基于閾值對(duì)設(shè)備進(jìn)行過(guò)濾去重之后赌厅,即可建立穩(wěn)定用戶(hù)基礎(chǔ)庫(kù)。之后的各項(xiàng)指標(biāo)計(jì)算都是基于穩(wěn)定用戶(hù)基礎(chǔ)庫(kù)進(jìn)行的轿塔。
對(duì)獲得的穩(wěn)定用戶(hù)基礎(chǔ)庫(kù)從時(shí)間特愿、空間維度上進(jìn)行聚類(lèi)篩選仲墨,可得到更豐富的統(tǒng)計(jì)結(jié)果。比如對(duì)省市聚類(lèi)洽议,可以獲得全國(guó)各省份全年的相關(guān)結(jié)果宗收;對(duì)時(shí)間聚類(lèi),可以獲得某一段特定時(shí)間的數(shù)據(jù)統(tǒng)計(jì)結(jié)果亚兄;考慮相鄰兩個(gè)月的人口遷移,可以得到省份的人口流入流出情況采驻。
人口統(tǒng)計(jì)實(shí)踐
下面展示TalkingData人口統(tǒng)計(jì)的部分實(shí)踐审胚。
① 2018年4月北京市十六區(qū)常住人口占比:
TalkingData人口統(tǒng)計(jì)團(tuán)隊(duì)用2016年8月份移動(dòng)運(yùn)營(yíng)商常住人口占比與2016年北京城十六區(qū)年鑒常住人口占比作為參考。對(duì)比發(fā)現(xiàn)礼旅,TalkingData計(jì)算得出的北京市區(qū)縣常住人口中膳叨,占比前四的區(qū)縣分別為朝陽(yáng)區(qū)、海淀區(qū)痘系、豐臺(tái)區(qū)和昌平區(qū)菲嘴,與運(yùn)營(yíng)商數(shù)據(jù)和統(tǒng)計(jì)年鑒一致,但TalkingData和運(yùn)營(yíng)商計(jì)算的朝陽(yáng)區(qū)常住人口占比都高于統(tǒng)計(jì)年鑒中的人口比例汰翠。
為了衡量TalkingData的計(jì)算準(zhǔn)確度龄坪,我們以2016年北京城十六區(qū)年鑒常住??? 人口占比為基準(zhǔn),對(duì)比TalkingData計(jì)算的人口占比的偏差程度复唤。對(duì)比發(fā)現(xiàn)健田,TalkingData與年鑒數(shù)據(jù)誤差的均值為0.98%,標(biāo)準(zhǔn)差為1.61%佛纫。移動(dòng)運(yùn)營(yíng)商數(shù)據(jù)與年鑒數(shù)據(jù)誤差的均值為0.90%妓局,標(biāo)準(zhǔn)差為1.47%。
② 2017年11月深圳區(qū)域常住人口占比:
TalkingData人口統(tǒng)計(jì)團(tuán)隊(duì)用2017年11月份移動(dòng)運(yùn)營(yíng)商計(jì)算的深圳常住人口占比與深圳統(tǒng)計(jì)局年鑒中的2016年常住人口占比作為參考呈宇。對(duì)比發(fā)現(xiàn)好爬,三份數(shù)據(jù)整體趨勢(shì)非常接近。
我們以年鑒的人口占比為基準(zhǔn)甥啄,對(duì)比TalkingData計(jì)算的人口占比的偏差程度存炮。對(duì)比發(fā)現(xiàn),TalkingData與年鑒數(shù)據(jù)誤差的均值為1.24%型豁,標(biāo)準(zhǔn)差為1.61%僵蛛。移動(dòng)運(yùn)營(yíng)商數(shù)據(jù)與年鑒數(shù)據(jù)誤差的均值為1.57%,標(biāo)準(zhǔn)差為1.81%迎变,二者很接近充尉,TalkingData略?xún)?yōu)于移動(dòng)運(yùn)營(yíng)商數(shù)據(jù)。
③ 2017年11至2018年4月北京市常住人口變化:
上圖為從2017年11至2018年4月份衣形,北京的常住人口變化趨勢(shì)驼侠。我們發(fā)現(xiàn)二月北京常住人口稍有減少姿鸿,我們認(rèn)為這是由“春運(yùn)”造成的,符合常識(shí)認(rèn)知倒源。
上圖分別展示了2017年11至2018年4月北京常住人口的環(huán)比變化趨勢(shì)苛预。北京常住人口總體在2017年11月份到2018年1月份體現(xiàn)出了下降趨勢(shì)。2018年2笋熬、3月份受春節(jié)影響热某,常住人口有超過(guò)7%的下降和回流。2018年3胳螟、4月份數(shù)據(jù)基本持平昔馋,有輕微的上升。
④ 2018年4月全國(guó)人口統(tǒng)計(jì):
上圖以2017年年鑒的全國(guó)省份數(shù)據(jù)為標(biāo)準(zhǔn)糖耸,對(duì)比了TalkingData計(jì)算的2018年4月的全國(guó)人口統(tǒng)計(jì)結(jié)果秘遏。我們發(fā)現(xiàn)誤差平均值為0.90%,標(biāo)準(zhǔn)差為1.21%嘉竟,TalkingData計(jì)算結(jié)果與年鑒占比相似程度較高邦危,具有較強(qiáng)的參考價(jià)值。
TalkingData 《2017年移動(dòng)互聯(lián)網(wǎng)行業(yè)發(fā)展報(bào)告》指出舍扰,截至2017年12月倦蚪,我國(guó)移動(dòng)智能終端規(guī)模達(dá)到14.2億臺(tái),且逐漸向三線(xiàn)及以下城市下沉妥粟,移動(dòng)互聯(lián)網(wǎng)已全面普及审丘。基于移動(dòng)位置大數(shù)據(jù)動(dòng)態(tài)人口統(tǒng)計(jì)方法將是未來(lái)人口統(tǒng)計(jì)的發(fā)展趨勢(shì)勾给,與傳統(tǒng)人口統(tǒng)計(jì)相結(jié)合滩报,能夠更好地幫助政府實(shí)現(xiàn)智慧的城市規(guī)劃與管理,實(shí)現(xiàn)人民生活環(huán)境的整體改善播急。