“從物理學(xué)角度看饶火,生命這種物質(zhì)運(yùn)動(dòng)形式鹏控,與其他的物質(zhì)運(yùn)動(dòng)相比并沒(méi)有更高的含義,從生命中你找不到新的物理規(guī)律肤寝,所以從我的角度看当辐,一個(gè)人的死與一塊冰的消融并沒(méi)有本質(zhì)的區(qū)別±鹂矗”
劉慈欣《地球往事》
目錄
- 前言
- 局域移動(dòng)
- 聚集傾向
- 交通效率
- 跨區(qū)流動(dòng)
- 相互影響
1. 前言
通過(guò)與某運(yùn)營(yíng)商合作缘揪,我們獲得了北京十萬(wàn)用戶的三十天內(nèi)的移動(dòng)和上網(wǎng)記錄數(shù)據(jù)。下文對(duì)一天內(nèi)的數(shù)據(jù)做若干簡(jiǎn)單分析∷律危可以做的事情有很多世吨,有待更多人加入研究團(tuán)隊(duì),一起把這個(gè)線發(fā)展成長(zhǎng)期研究的方向呻征。
2. 局域移動(dòng)
![每個(gè)點(diǎn)是一個(gè)基站耘婚,信息流量越大的基站顏色越紅](http://ww1.sinaimg.cn/large/e85abbb5jw1emw6donft7j20nc0mq455.jpg)
數(shù)據(jù)中一共有一萬(wàn)多基站陆赋。顯然沐祷,基站更多地會(huì)被安放在人口密度較大的地區(qū)。因此從基站的分布也能看出北京人口的聚集情況攒岛。
![根據(jù)用戶移動(dòng)對(duì)基站進(jìn)行聚類](http://ww4.sinaimg.cn/large/e85abbb5jw1emx0n4vtplj20nc0mqaeo.jpg)
人口的聚集不僅僅是居住地的聚集赖临。大多數(shù)的日常移動(dòng)軌跡都在一個(gè)小范圍內(nèi)[1]。以基站為節(jié)點(diǎn)灾锯,以用戶流動(dòng)為鏈邊構(gòu)建網(wǎng)絡(luò)兢榨,對(duì)這個(gè)網(wǎng)絡(luò)的最大聯(lián)通集團(tuán)進(jìn)行k clique communities聚類[2]可以得到兩百多個(gè)小的社區(qū),其中最大的10個(gè)社區(qū)如圖所示顺饮。聚集得到的社區(qū)反映了北京居民日常移動(dòng)的局域性吵聪。
3. 聚集傾向
![基站流距離的分布及其與流量的關(guān)系](http://ww3.sinaimg.cn/large/e85abbb5jw1emxchw5qoej20ra0dfdhd.jpg)
我們將從“源”到基站的平均加權(quán)步長(zhǎng)稱為“流長(zhǎng)度”,使用這個(gè)指標(biāo)來(lái)刻畫移動(dòng)網(wǎng)絡(luò)兼雄。我們發(fā)現(xiàn)除了一大批流長(zhǎng)度為1的基站外吟逝,流距離基本上呈正態(tài)分布。同時(shí)基站的流距離與流量正相關(guān)(Pearson r = 0.23, p-value < 0.01)赦肋,說(shuō)明人群在聚集而不是耗散块攒。從“源”到“匯”的“流長(zhǎng)度”是5.7,意味著平均來(lái)說(shuō)一天之內(nèi)用戶要經(jīng)過(guò)六個(gè)基站佃乘。
![基站流距離](http://ww4.sinaimg.cn/large/e85abbb5jw1emxe5531f8j20nc0mqtf1.jpg)
從上圖中也能看出用戶從四面八方聚集到城中心囱井。
4. 交通效率
![北京最大的四個(gè)交通障礙區(qū):軍博,奧體中心趣避,亦莊庞呕,北理工](http://ww4.sinaimg.cn/large/e85abbb5jw1emxl5ftm25j20rb0qngs9.jpg)
除了流長(zhǎng)度外,我們也可以在移動(dòng)網(wǎng)絡(luò)上計(jì)算任意一對(duì)節(jié)點(diǎn)之間的流距離骆捧。而后我們對(duì)于每一個(gè)節(jié)點(diǎn)i澎羞,只保留outbound流距離最大的節(jié)點(diǎn)j,這樣我們就構(gòu)建了一個(gè)最大生成樹敛苇。這個(gè)樹中入度比較高的點(diǎn)就是當(dāng)?shù)亟煌ㄗ钣写纳频狞c(diǎn):大量用戶從不同的地方來(lái)到這里妆绞,但卻又需要經(jīng)過(guò)多次換乘顺呕。類似的方法還可用于分析交通最有效率的地區(qū)。
![基站流距離與實(shí)際地理距離的關(guān)系](http://ww1.sinaimg.cn/large/e85abbb5jw1emxdzw5ggpj20wu0aq763.jpg)
我們發(fā)現(xiàn)括饶,基站之間流距離與地理距離正相關(guān)(Pearson r = 0.02, p-value < 0.01)株茶。如果交通網(wǎng)絡(luò)是一個(gè)球面上均勻分布的二維網(wǎng)格,那么流距離與地理距離之間應(yīng)該是系數(shù)為1的線性關(guān)系图焰。因此實(shí)際交通系統(tǒng)是一個(gè)比均勻分布的交通系統(tǒng)更高效的系統(tǒng)启盛。然而即使對(duì)于這樣一個(gè)高效系統(tǒng),如上文分析技羔,仍然有許多改善的余地僵闯。
5. 跨區(qū)流動(dòng)
![移動(dòng)速度](http://ww4.sinaimg.cn/large/e85abbb5jw1emxmk7hd89j20nc0mqjw1.jpg)
![移動(dòng)速度及在信息傳遞中的位置](http://ww3.sinaimg.cn/large/e85abbb5jw1emxmpkj7cyj20wu0aognn.jpg)
我們發(fā)現(xiàn),用戶的移動(dòng)速度是對(duì)數(shù)正態(tài)分布藤滥。大多數(shù)人移動(dòng)比較慢鳖粟,少數(shù)人移動(dòng)較快。人與人之間的移動(dòng)速度差別是幾何級(jí)的拙绊。從地圖上可以看出向图,區(qū)域之間的移動(dòng)比較快,區(qū)域內(nèi)的移動(dòng)比較慢标沪。
6. 相互影響
![移動(dòng)速度及在信息傳遞中的位置](http://ww3.sinaimg.cn/large/e85abbb5jw1emxmvw60dgj20jr0fqgmz.jpg)
通過(guò)用戶的上網(wǎng)行為榄攀,我們可以構(gòu)建用戶網(wǎng)絡(luò)。如果用戶i和用戶j先后上了同一個(gè)網(wǎng)站谨娜,我們計(jì)算i上傳的信息流量和j下載的信息流量航攒,將兩者加總作為鏈邊權(quán)重磺陡,視為用戶之間的互動(dòng)強(qiáng)度趴梢。在這個(gè)網(wǎng)絡(luò)上,對(duì)用戶計(jì)算流長(zhǎng)度币他,可以看出用戶在信息交流中是主動(dòng)還是被動(dòng)的坞靶,是影響別人還是被別人影響。
我們發(fā)現(xiàn)蝴悉,用戶的移動(dòng)速度與在信息傳遞鏈中的位置負(fù)相關(guān)(Pearson r = -0.01, p-value = 0.02)彰阴。這可能是由于移動(dòng)速度較快的用戶社會(huì)經(jīng)濟(jì)地位較高,在社會(huì)交往中也更加主動(dòng)拍冠。