一驶鹉、 全球互聯(lián)網(wǎng)用戶分析
我們從圖表中看到绩蜻,增長率從2010年開始整體還在增長铣墨,但是增速還是下降為主室埋,在2018年的時候出現(xiàn)了個反彈。也就是說增速是一直在降低伊约,這個是什么原因?qū)е碌哪匾ο炕ヂ?lián)網(wǎng)用戶還能增長多少呢?我們通過全球人口數(shù)據(jù)分析得到如下展示屡律。
我們要先了解目前全球總?cè)丝跀?shù)腌逢,我們通過互聯(lián)網(wǎng)搜索下全球人口,找到一個2019年世界人口排名的網(wǎng)頁超埋,我們可以通過Power Query來獲取其數(shù)據(jù)來進(jìn)行下一步的分析搏讶。https://www.phb123.com/city/renkou/rk.html
1. 數(shù)據(jù)抓取
我們打開網(wǎng)頁可以看到這個是有多個頁面組成的一個數(shù)據(jù)表佳鳖,我們點(diǎn)擊末頁可以看下一共有多少頁(這個是為了方便我們循環(huán)抓取使用)。點(diǎn)擊后發(fā)現(xiàn)一共12頁媒惕,同時網(wǎng)頁地址是這樣的系吩。https://www.phb123.com/city/renkou/rk_12.html
也就是說,最終網(wǎng)頁變化的就是rk_之后的這個數(shù)字妒蔚。那我們進(jìn)入Power Query里面穿挨,看下如何進(jìn)行抓取。
使用從web導(dǎo)入的方式隨便導(dǎo)入其一頁的地址肴盏,可以發(fā)現(xiàn)數(shù)據(jù)是存在在Table 0標(biāo)簽里的科盛。
我們勾選Table 0后可以進(jìn)入到編輯頁面,并打開高級編輯器菜皂,可以看到里面主要是有3行代碼贞绵。源,Data0也就是導(dǎo)航以及更改類型3個步驟幌墓。我們可以把源和Data0組合下但壮。
我們主要是針對第一條代碼進(jìn)行循環(huán)抓取。
List.Transform({1..12}, each
Web.Page(Web.Contents("https://www.phb123.com/city/renkou/rk_"
& Text.From(_) &
".html"
)
){0}[Data]
)
得到一個包含表格的列表格式常侣。
我們再次轉(zhuǎn)換成表格并展開即可得到我們所需要的數(shù)據(jù)蜡饵。并在最后一步把數(shù)據(jù)格式都調(diào)整下并加載到Power BI的表里。
2. 在Power Pivot里面進(jìn)行格式調(diào)整胳施。
對國家這里把數(shù)據(jù)分類選擇為國家/地區(qū)溯祸;增長率格式為百分比,并保留3位小數(shù)舞肆;人口數(shù)量這里也可以改成千分位焦辅。
3. 編寫度量值
A. 世界總?cè)丝跀?shù)
世界總?cè)丝?= Round(Sum([人口數(shù)量])/100000000,3)
解釋:
因?yàn)槲覀儾恍枰芫_,一般表示世界人口可以用億為單位椿胯,所以這里就直接求和后除以億并保留3位小數(shù)筷登。
B. 數(shù)量最多的前20位國家人口數(shù)量
人口top20 =
var top20_rk=Topn(20,All('世界人口'[國家]),[世界總?cè)丝赸)
return Calculate([世界總?cè)丝赸,top20_rk,Values('世界人口'[國家]))
解釋:
因?yàn)槲覀儾榭磾?shù)據(jù)都是以國家為維度,所以在求Top20的時候需要添加All來忽略國家的維度哩盲。但是最后要僅顯示前20位的時候前方,則還需要把維度還原,所以用了Values廉油。
C. 數(shù)量最多的前20位國家的人口增長率
Top20_增長率 = Calculate(Average('世界人口'[增長率]),
TopN(20,
All('世界人口'[國家]),
'世界人口'[世界總?cè)丝赸,
DesC),
Values('世界人口'[國家])
)
解釋:
寫法差不多惠险,只不過這里省略了變量,同時求和改成了平均值(這里無所謂是用哪個抒线,因?yàn)樽罱K會被篩選成為唯一值班巩,只不過增長率一般來說不大會用累計(jì)求和)。
4. 可視化展示
這里我們一共用了2個圖形嘶炭,一個是地圖抱慌,一個是折線和簇狀柱形圖逊桦。
A. 地圖
可視化選項(xiàng)里面選擇地圖。
把對應(yīng)的維度及數(shù)據(jù)拖入進(jìn)對應(yīng)的地方即可抑进。
在屬性里面卫袒,可以把標(biāo)簽類別的字體大小,氣泡的大小相應(yīng)改動即能得到如上效果单匣。
B. 折線和簇狀柱形圖
可視化里新建一個折線和簇狀柱形圖
把共享軸夕凝,列值,行值分別填入相對應(yīng)的數(shù)據(jù)户秤。
更改X軸國家字段以及標(biāo)簽的文字大小码秉,調(diào)整到合適位置。
因?yàn)槲覀儼阎螆D和折線圖相對分隔開鸡号,所以就需要調(diào)整Y軸的最大值和最小值以便能夠讓圖形看起來更容易转砖。
這里我們把人口的最大值改為20,增長率的最小值改為-0.15鲸伴,這樣就能把柱形圖和折線圖相對的隔開府蔗。
這樣我們就把這張世界人口圖給做好了。
那我們做國際貿(mào)易汞窗,使用這張圖能知道些什么呢姓赤?
5. 分析結(jié)果
目前全世界總?cè)丝诩s為75.8億人,互聯(lián)網(wǎng)用戶目前為不到40億仲吏,正好和后面一張分析圖形成51%的互聯(lián)網(wǎng)滲透率的對應(yīng)關(guān)系不铆,數(shù)據(jù)能夠得到相互印證。