python數據可視化1:單特征

背景音樂:Summer Vibe - Walk off the Earth

缀纺迹看到這篇文章的人,每天都有好心情?(? ? ??)

1 概述

數據可視化,從數據層面,包括以下兩塊內容:

  1. 單變量的可視化:主要研究變量的自身特性
  2. 多變量的聯(lián)合可視化:主要研究變量與變量之間的相關性

其中湃密,單變量的可視化,要根據數據的類型來分別處理:

  1. 分類變量(categorical variable)
    常用的有:餅圖、柱形圖
  2. 數值變量(numerical variable)
    常用的有:概率密度圖迟螺、直方圖赶掖、箱式圖

回到標題本身,今天就來講講python的數據可視化达箍。

在python做數據分析的時候没龙,有三個模塊是繞不開的:pandasnumpy以及matplotlib缎玫。

同時硬纤,seaborn也是你可視化時必不可少的得力助手。

寫這個文章的目的赃磨,是對知識的一個梳理筝家,也方便有需要的人能盡快上手。

我會盡可能地用pandas邻辉、matplotlib和seaborn來共同實現上述可視化溪王,同時為了代碼簡潔,我會盡量不進行沒必要的設置值骇。

2 導入數據

首先莹菱,導入必備的模塊:

%matplotlib inline
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
import seaborn as sns

本次所用的數據來自kaggle競賽的森林火災面積預測

df = pd.read_csv('forestfires.csv')
df.head() # 看前5行

數據內容

3 分類特征

分類特征主要看兩個方面:

  1. 有幾種分類
  2. 每種分類的數量(或者比例)

這里為了演示,我用day變量吱瘩,代表了星期

order = ['mon', 'tue', 'wed', 'thu', 'fri', 'sat', 'sun']
day_count = df['day'].value_counts()
day_count = day_count[order] # 不用loc的話就默認從大到小排序
day_count

結果為

mon 74
tue 64
wed 54
thu 61
fri 85
sat 84
sun 95
Name: day, dtype: int64

可以看到道伟,數據集里這個變量的分布還算平均。

3.1 餅圖

注意分類的種類不能太多使碾,不然餅圖就會被切得很細

3.1.1 pandas.Series.plot.pie

用autopct設置數字的格式

day_count.plot.pie(autopct='%.2f%%')

3.1.2 matplotlib.pyplot.pie

plt.pie(day_count, autopct='%.2f%%', labels=day_count.index)

3.2 柱狀圖

3.2.1 pandas.Series.plot.pie

day_count.plot.bar()

3.2.2 matplotlib.pyplot.bar

pos = range(len(day_count))
plt.bar(pos, day_count.values)
plt.xticks(pos, day_count.index)

3.2.3 seaborn.barplot

sns.barplot(day_count.index, day_count.values)

3.2.4 seaborn.countplot

用這個的好處在于皱卓,自動計算取值及其數量并可視化,節(jié)省一個步驟部逮。
函數中娜汁,可以設置order=order來指定順序。

sns.countplot(df['day'])

4 數值特征

數值特征主要看兩個方面:

  1. 它的取值區(qū)間
  2. 不同子區(qū)間的數量分布(或者密度分布)

為了演示兄朋,我用temp變量掐禁,代表溫度

temperature = df['temp']

4.1 直方圖

4.1.1 pandas.Series.plot.hist

temperature.plot.hist()

4.1.2 matplotlib.pyplot.hist

plt.hist(temperature)

4.1.3 seaborn.rugplot

這個是結合直方圖使用的,能變得更好看

plt.hist(temperature, color='orange')
sns.rugplot(temperature)

4.2 概率密度圖

4.2.1 pandas.Series.plot.density

temperature.plot.density()

4.2.2 seaborn.kdeplot

sns.kdeplot(temperature)

4.2.3 seaborn.distplot

這個還結合了直方圖颅和,節(jié)省步驟
函數中傅事,可以設置hist=False來取消直方圖

sns.distplot(temperature)

4.3 箱式圖

4.3.1 pandas.Series.plot.box

temperature.plot.box()

4.3.2 matplotlib.pyplot.boxplot

plt.boxplot(temperature)
plt.show()

4.3.3 seaborn.boxplot

orient默認值是h(水平),也可以設為v(垂直)

sns.boxplot(temperature, orient='v')

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末峡扩,一起剝皮案震驚了整個濱河市蹭越,隨后出現的幾起案子,更是在濱河造成了極大的恐慌教届,老刑警劉巖响鹃,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件驾霜,死亡現場離奇詭異,居然都是意外死亡买置,警方通過查閱死者的電腦和手機粪糙,發(fā)現死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來忿项,“玉大人蓉冈,你說我怎么就攤上這事⌒ィ” “怎么了寞酿?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長脱柱。 經常有香客問我熟嫩,道長,這世上最難降的妖魔是什么褐捻? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任掸茅,我火速辦了婚禮,結果婚禮上柠逞,老公的妹妹穿的比我還像新娘昧狮。我一直安慰自己,他們只是感情好板壮,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布逗鸣。 她就那樣靜靜地躺著,像睡著了一般绰精。 火紅的嫁衣襯著肌膚如雪撒璧。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天笨使,我揣著相機與錄音卿樱,去河邊找鬼。 笑死硫椰,一個胖子當著我的面吹牛繁调,可吹牛的內容都是我干的。 我是一名探鬼主播靶草,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼蹄胰,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了奕翔?” 一聲冷哼從身側響起裕寨,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后宾袜,有當地人在樹林里發(fā)現了一具尸體捻艳,經...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年试和,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片纫普。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡阅悍,死狀恐怖,靈堂內的尸體忽然破棺而出昨稼,到底是詐尸還是另有隱情节视,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布假栓,位于F島的核電站寻行,受9級特大地震影響,放射性物質發(fā)生泄漏匾荆。R本人自食惡果不足惜拌蜘,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望牙丽。 院中可真熱鬧简卧,春花似錦、人聲如沸烤芦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽构罗。三九已至铜涉,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間遂唧,已是汗流浹背芙代。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留盖彭,地道東北人链蕊。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像谬泌,于是被迫代替她去往敵國和親滔韵。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內容