從2019年底至今國內(nèi)遭受新冠病毒侵襲姨蟋,舉國上下同心共戰(zhàn)“疫”!大家也都注意到了眼溶,除國家每天都會公布疫情最新數(shù)據(jù)外,各大互聯(lián)網(wǎng)公司也都發(fā)布了“疫情地圖”灌旧,支付寶首頁、微信的“醫(yī)療健康”枢泰、百度首頁等等每天都會更新“疫情數(shù)據(jù)”铝噩,讓大家能夠更加清晰直觀地了解疫情狀況衡蚂。那么這個“疫情地圖”是如何產(chǎn)生的骏庸,你知道嗎?今天我就簡要和大家介紹下整個技術(shù)流程玻募。
數(shù)據(jù)來源
國家衛(wèi)健委一姿、各地方衛(wèi)健委每天會在其官網(wǎng)公布最新疫情數(shù)據(jù),這是最權(quán)威的數(shù)據(jù)來源啸蜜,無論是支付寶、微信衬横、百度的疫情地圖旁邊都能找到類似 數(shù)據(jù)來源:根據(jù)國家衛(wèi)健委、各省市區(qū)政府衛(wèi)健委遥诉。拇泣。等字樣矮锈,衛(wèi)健委公布的數(shù)據(jù)就是他們的數(shù)據(jù)來源。
數(shù)據(jù)采集
上圖是國家衛(wèi)健委公布的截至2月25日的疫情情況债朵。想象一下如何在Excel去制作一個柱狀圖或者餅圖瀑凝,直接把這些文字拷進(jìn)Excel里是沒有辦法生成一個圖表的序芦。同樣的粤咪,制作“疫情地圖”也需要類似下圖的結(jié)構(gòu)化數(shù)據(jù)(當(dāng)然實際這些數(shù)據(jù)是存儲到數(shù)據(jù)庫的)。
那么如何去各個衛(wèi)健委網(wǎng)站整理這些數(shù)據(jù)呢宪塔?最笨最耗時的辦法當(dāng)然就是人工每天去瀏覽每個網(wǎng)站囊拜,自己整理出這樣的數(shù)據(jù)。顯然這樣做耗時耗力又容易出錯艾疟。實際應(yīng)該是通過 網(wǎng)絡(luò)爬蟲敢辩,讓程序每天自動的去抓取各網(wǎng)站數(shù)據(jù),然后自動整理戚长,自動寫入數(shù)據(jù)庫。這就需要程序員去寫這個爬蟲的程序去實現(xiàn)這些功能同廉。
數(shù)據(jù)展示
好了,現(xiàn)在已經(jīng)有了結(jié)構(gòu)化的數(shù)據(jù)锅劝,并且已經(jīng)存入了數(shù)據(jù)庫。接下里就是如何制作上述提到的數(shù)據(jù)地圖了故爵。實際上已經(jīng)有很多成熟的前端框架(例如百度的Echarts隅津,高德地圖劲室,等等
),只要把數(shù)據(jù)按要求“灌入”這些框架中很洋,自然就能呈現(xiàn)出各種效果了隧枫。當(dāng)然這個過程需要寫后端代碼去獲取數(shù)據(jù)庫里數(shù)據(jù)返給前臺喉磁,前端拿到數(shù)據(jù)后也需要寫相應(yīng)代碼去實現(xiàn)這些功能悠垛。
圖片源自網(wǎng)絡(luò)确买,侵權(quán)必刪!