16《Python 原生爬蟲教程》數(shù)據(jù)可視化

在我們開始的我們的可視化的之旅之前,需要簡單的介紹一些數(shù)據(jù)分析工具哈蝇,我們的數(shù)據(jù)可視化的任務(wù)也是建立在數(shù)據(jù)分析的基礎(chǔ)之上。Python 的主要數(shù)據(jù)分析工具如下所示:

  • Numpy:這個是數(shù)據(jù)計算的工具攘已,主要用來進(jìn)行矩陣的運算炮赦,矢量運算等等。
  • Scipy:科學(xué)計算函數(shù)庫样勃,主要用在學(xué)術(shù)領(lǐng)域吠勘,主要包含線性代數(shù)模塊,信號與圖像處理模塊峡眶,統(tǒng)計學(xué)模塊等等剧防。
  • Sympy:數(shù)學(xué)符號計算庫
  • Pandas:包含了 numpy 的各種功能,并提供了更加強大的函數(shù)辫樱,以及更加豐富的數(shù)據(jù)模型峭拘。
    Pandas的主要數(shù)據(jù)結(jié)構(gòu)為 Series 和 DataFrame。
    • Series 可以當(dāng)作是一般的數(shù)組狮暑,區(qū)別就是Series數(shù)組有索引的性質(zhì)棚唆,這個和普通的數(shù)組十分不同。我們可以通過series.index來獲取index的值心例。
    • DataFrame 可以把它想像成數(shù)據(jù)的表格的概念宵凌,它是把一個或者多個Series按照邏輯合并后的二維數(shù)據(jù)結(jié)構(gòu)。

接下來讓我們開始我們數(shù)據(jù)可視化之旅吧止后。

首選瞎惫,我們來畫一張最基本的直方圖。

from matplotlib import pyplot //引入matplotlib庫進(jìn)行繪制圖形
import numpy as np  //引入numpy,來生成隨機(jī)數(shù)
x = np.arage(12)
y = np.random.rand(12)
labels = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec]
pyplot.bar(x,y, color='red', tick_label=labels)  //繪制條形圖
pyplot.title('first chart')
plot.show()

00831rSTgy1gcic2w1j1dj30hs0dcdfp.jpg

上面這幅是條形圖译株,我們可以看到 x 軸是月份瓜喇,總共分為 12 個月,縱軸則是每個月的數(shù)值在 0-1 之間的值歉糜。

x = np.random.randn(800)
pyplot.hist(x,150)   //繪制直方圖
pyplot.title('second chart')
pyplot.show()

00831rSTgy1gcidh9hagzj30hs0dcaap.jpg

上面這幅是直方圖乘寒,默認(rèn)的為藍(lán)色,數(shù)據(jù)在我們?nèi)‰S機(jī)數(shù)之后匪补,基本上是呈現(xiàn)一個對稱分布的情況伞辛。

from mpl_toolkits.mplot3d import Axes3D   //引入三維圖形包

pic = pyplot.figure()
ax = Axes3D(pic)
x = np.arange(-1, 3, 0.3)  //x軸取值范圍
y = np.arange(-1, 3, 0.3   //y軸取值范圍
a, b = np.meshgrid(x,y)    //繪制二維圖形
c = a**2 + b **2
ax.plot_surface(a,b,c, cmap= pyplot.get_cmap('rainbow')) //繪制三維圖
ax.set_zlim(-1, 10)
pyplot.title('last chart')
pyplot.show()

除了簡單的二維圖形烂翰,同樣,matplotlib 也可以很輕松的繪制三維圖形蚤氏,上面的代碼就是我們繪制三位圖形的簡單版本甘耿,效果如下所示:

00831rSTgy1gcidh9hagzj30hs0dcaap.jpg

總結(jié)

爬蟲只是我們獲取數(shù)據(jù)的第一步,我們最終的目的是要讓數(shù)據(jù)服務(wù)于人類竿滨,因此佳恬,我們需要Numpy,Pandas 等數(shù)據(jù)分析工具分析數(shù)據(jù),然后使用 matplotlib 工具來繪制可視化圖形于游,從而讓我們的數(shù)據(jù)更加生動毁葱,更加被一般用戶所理解和使用。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末贰剥,一起剝皮案震驚了整個濱河市倾剿,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌鸠澈,老刑警劉巖柱告,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件截驮,死亡現(xiàn)場離奇詭異笑陈,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)葵袭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進(jìn)店門涵妥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人坡锡,你說我怎么就攤上這事蓬网。” “怎么了鹉勒?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵帆锋,是天一觀的道長。 經(jīng)常有香客問我禽额,道長锯厢,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任脯倒,我火速辦了婚禮实辑,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘藻丢。我一直安慰自己剪撬,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布悠反。 她就那樣靜靜地躺著残黑,像睡著了一般馍佑。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上萍摊,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天挤茄,我揣著相機(jī)與錄音,去河邊找鬼冰木。 笑死穷劈,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的踊沸。 我是一名探鬼主播歇终,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼逼龟!你這毒婦竟也來了评凝?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤腺律,失蹤者是張志新(化名)和其女友劉穎奕短,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體匀钧,經(jīng)...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡翎碑,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了之斯。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片日杈。...
    茶點故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖佑刷,靈堂內(nèi)的尸體忽然破棺而出莉擒,到底是詐尸還是另有隱情,我是刑警寧澤瘫絮,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布涨冀,位于F島的核電站,受9級特大地震影響麦萤,放射性物質(zhì)發(fā)生泄漏鹿鳖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一频鉴、第九天 我趴在偏房一處隱蔽的房頂上張望栓辜。 院中可真熱鬧,春花似錦垛孔、人聲如沸藕甩。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽狭莱。三九已至僵娃,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間腋妙,已是汗流浹背默怨。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留骤素,地道東北人匙睹。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像济竹,于是被迫代替她去往敵國和親痕檬。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內(nèi)容