聊騷
不知道大家有沒有碰到這樣的一種情況放钦。我們?cè)陂_發(fā)的時(shí)候,大部分的項(xiàng)目都是需要用到省市縣(區(qū))的數(shù)據(jù)的恭金,但是其實(shí)我不知道我怎么獲取到完整的這些數(shù)據(jù)操禀。換句話說就是我怎么才能得到權(quán)威的數(shù)據(jù)。
網(wǎng)上其實(shí)有一大片這樣的數(shù)據(jù)横腿,但是不能保證是不是我們想要的數(shù)據(jù)颓屑,也不能保證數(shù)據(jù)的準(zhǔn)確性辙培。所以其實(shí)我們需要的是如何得到完整和準(zhǔn)確的數(shù)據(jù),這樣不管你怎么變邢锯,我們都能得到我們想要的扬蕊。
授人以魚不如授人以漁就是這么個(gè)理了。
給你們漁
就是上面的那個(gè)網(wǎng)站丹擎,國(guó)家統(tǒng)計(jì)局尾抑,厲害吧。點(diǎn)開看蒂培,然后按下圖指引操作:
然后就進(jìn)入到下面的圖片了再愈。沒有什么意外,就是繼續(xù)操作护戳。
好翎冲,看到數(shù)據(jù)了,記錄了所有的省媳荒、直轄市抗悍、自治區(qū)。我們點(diǎn)開廣東省看下钳枕。
廣東省對(duì)應(yīng)的市也顯示出來了缴渊,還有對(duì)應(yīng)的代碼,可以說很棒了鱼炒。要獲取對(duì)應(yīng)區(qū)的數(shù)據(jù)衔沼,繼續(xù)往下點(diǎn)就ok了。
問題
至此昔瞧,我們找到了我們想要的數(shù)據(jù)了指蚁,但是問題是:我們?cè)趺吹玫竭@些數(shù)據(jù)(名稱和代碼)。不可能我們一個(gè)個(gè)的去統(tǒng)計(jì)吧自晰!
我們當(dāng)然想到用程序處理凝化。那么我們就需要爬取對(duì)應(yīng)的數(shù)據(jù),并做相應(yīng)的解析缀磕。爬取數(shù)據(jù)缘圈,大家的第一反應(yīng)是用python
爬取,但是很慚愧袜蚕,我并不會(huì)python
糟把。當(dāng)然java
也是有辦法爬取的,那就是 jsoup牲剃。
具體的內(nèi)容請(qǐng)看 省市區(qū)數(shù)據(jù)獲取 - Jsoup解析網(wǎng)頁(yè)獲取遣疯。