《Python 3爬蟲(chóng)背捌、數(shù)據(jù)清洗與可視化實(shí)戰(zhàn)》本書(shū)是一本通過(guò)實(shí)戰(zhàn)教初學(xué)者學(xué)習(xí)爬取數(shù)據(jù)、清洗和組織數(shù)據(jù)進(jìn)行分析和可視化的Python 讀物洞斯。書(shū)中案例均經(jīng)過(guò)實(shí)戰(zhàn)檢驗(yàn)毡庆,筆者在實(shí)踐過(guò)程中深感采集數(shù)據(jù)、清洗和組織數(shù)據(jù)的重要性烙如,作為一名數(shù)據(jù)行業(yè)的“碼農(nóng)”扭仁,數(shù)據(jù)就是沃土,沒(méi)有數(shù)據(jù)厅翔,我們將無(wú)田可耕乖坠。
本書(shū)共13章,包括6個(gè)核心主題刀闷,其一是Python 基礎(chǔ)入門(mén)熊泵,包括環(huán)境配置、基本操作甸昏、數(shù)據(jù)類(lèi)型顽分、語(yǔ)句和函數(shù);其二是Python 爬蟲(chóng)的構(gòu)建施蜜,包括網(wǎng)頁(yè)結(jié)構(gòu)解析卒蘸、爬蟲(chóng)流程設(shè)計(jì)、代碼優(yōu)化、爬蟲(chóng)效率優(yōu)化缸沃、無(wú)線端的數(shù)據(jù)采集恰起、容錯(cuò)處理、反防爬蟲(chóng)趾牧、表單交互和模擬頁(yè)面點(diǎn)擊检盼;其三是Python數(shù)據(jù)庫(kù)應(yīng)用,包括MongoDB翘单、MySQL 在Python 中的連接與應(yīng)用吨枉;其四是數(shù)據(jù)清洗和組織,包括NumPy 數(shù)組知識(shí)哄芜,以及pandas 數(shù)據(jù)的讀寫(xiě)貌亭、分組、變形认臊,缺失值属提、異常值和重復(fù)值處理,時(shí)序數(shù)據(jù)處理和正則表達(dá)式的使用等美尸;其五是綜合應(yīng)用實(shí)例,幫助讀者貫穿爬蟲(chóng)斟薇、數(shù)據(jù)清洗與組織的過(guò)程师坎;最后是數(shù)據(jù)可視化,包括matplotlib 和pyecharts 兩個(gè)庫(kù)的使用堪滨,涉及餅圖胯陋、柱形圖、線圖袱箱、詞云圖等圖形遏乔,幫助讀者進(jìn)入可視化的殿堂。
免費(fèi)下載地址:
Python 3爬蟲(chóng)发笔、數(shù)據(jù)清洗與可視化實(shí)