Pandas庫的介紹

Pandas庫的引用

Pandas是python第三方庫渺杉,提供高性能易用數(shù)據(jù)類型和分析工具

import pandas as pd

Pandas基于Numpy實現(xiàn)彤钟,常與Numpy和Matplotlib一同使用


Pandas庫的理解

兩個數(shù)據(jù)類型:Series坠七,DataFrame

基于上述數(shù)據(jù)類型的各類操作(基本操作、運算操作莹妒、特征類操作赶站、關(guān)聯(lián)類操作)


Pandas庫的Series類型



Series類型可以由如下類型創(chuàng)建:

1.python列表,index與列表元素個數(shù)一致

2.標量值,index表達Series類型的尺寸

3.python字典产喉,鍵值對中的‘鍵’是索引捂掰,index從字典中進行選擇操作

4.ndarray,索引和數(shù)據(jù)都可以通過ndarray類型創(chuàng)建

5.其他函數(shù)曾沈,range()函數(shù)等


Series類型的基本操作

Series類型包括index和value兩部分

Series類型的操作類似ndarray類型

Series類型的操作類似python字典類型


Series類型的操作類似ndarray類型:

1.索引方法相同这嚣,采用[]

2.numpy中運算和操作可用于series類型

3.可以通過自定義索引的列表進行切片

4.可以通過自動索引進行切片,如果存在自定義索引塞俱,則一同被切片

Series類型的操作類似python字典類型:

1.通過自定義索引訪問

2.保留字in操作

3.使用.get()方法

Series是一維帶‘標簽’數(shù)組

index_0?? --->data_a

Series基本操作類似ndarray和字典姐帚,根據(jù)索引對齊


DataFrame類型可以由如下類型創(chuàng)建:

1.二維ndarray對象

2.由一維ndarray、列表敛腌、字典卧土、元組或Series構(gòu)成的字典

3.Series類型

4.其他的DataFrame類型


Pandas庫的數(shù)據(jù)類型操作


重新索引

.reindex(index=None,columns=None,...)的參數(shù)

index,columns??????????? 新的行列自定義索引

fill_value?????????????????????? 重新索引中惫皱,用于填充缺失位置的值

method?????????????????????? 填充方法像樊,ffill當(dāng)前值向前填充尤莺,bfill向后填充

limit???????????????????????????? 最大填充量

copy???????????????????????????? 默認true,生成新的對象生棍,false時颤霎,新舊相等不復(fù)制

索引類型的常用方法

.append(idx)?????????? 鏈接另一個index對象,產(chǎn)生新的index對象

.diff(idx)??????????????????? 計算差集涂滴,產(chǎn)生新的index對象

.intersection(idx)??????? 計算交集

.union(idx)?????????????????? 計算并集

.delete(loc)??????????????? 刪除loc位置處的元素

.insert(loc,e)?????????????? 在loc位置增加一個元素e

Pandas庫的數(shù)據(jù)類型運算

算術(shù)運算法則

算術(shù)運算根據(jù)行列索引友酱,補齊后運算,運算默認產(chǎn)生浮點數(shù)

補齊時缺項填充NaN(空值)

二維和一維柔纵、一維和零維間為廣播運算

采用+ - * /符號進行的二元運算產(chǎn)生新的對象

方法形式運算

.add(d,**argws)??? 類型間加法運算缔杉,可選參數(shù)

.sub(d,**argws)? ? 類型間減法運算,可選參數(shù)

.mul(d,**argws)? ? 類型間乘法運算搁料,可選參數(shù)

.div(d,**argws)? ? 類型間除法運算或详,可選參數(shù)

比較運算法則

比較運算只能比較相同索引的元素,不進行補齊

二維和一維郭计、一維和零維間為廣播運算

采用>? <? >=? <=? ==? !=等符號進行的二元運算產(chǎn)生布爾對象

Pandas的數(shù)據(jù)特征分析


.sort_values()方法在指定軸上根據(jù)數(shù)值進行排序霸琴,默認升序

Series.sort_values(axis=0,ascending=True)

DataFrame.sort_values(by,axis=0,ascending=True)

?????????????????? by:axis軸上的某個索引或索引列表

基本統(tǒng)計分析函數(shù)

適用于Series和DataFrame類型

.sum()?????????? 計算數(shù)據(jù)的總和,按0軸計算昭伸,下同

.count()???????? 非NaN值的數(shù)量

.mean()? .median()?? 計算數(shù)據(jù)的算術(shù)平均值梧乘,算術(shù)中位數(shù)

.var()?? .std()????? 計算數(shù)據(jù)的方差、標準差

.min()???? .max()???? 計算數(shù)據(jù)的最小值庐杨、最大值

.describe()???????? 針對0軸(各列)的統(tǒng)計匯總

適用于Series

.argmin()??? .argmax()??? 計算數(shù)據(jù)最大值选调、最小值所在位置的索引位置(自動索引)

.idxmin()???? .idxmax() ?? 計算數(shù)據(jù)最大值、最小值所在位置的索引(自定義索引)

累計統(tǒng)計分析函數(shù)

適用于Series和DataFrame類型灵份,累計計算

.cumsun()????????????????? 依次給出前1仁堪、2、...各吨、n個數(shù)的和

.cumprod()? ? ? ? ? ? ? ?? 依次給出前1枝笨、2、...揭蜒、n個數(shù)的積

.cummax()? ? ? ? ? ? ? ??? 依次給出前1横浑、2、...屉更、n個數(shù)的最大值

.cummin()?????????????????? 依次給出前1徙融、2、....瑰谜、n個數(shù)的最小值


適用于Series和DataFrame類型欺冀,滾動計算(窗口計算)

.rolling(w).sum()??????????????? 依次計算相鄰w個元素的和

.rolling(w).mean()? ? ? ? ? ? ?? 依次計算相鄰w個元素的算術(shù)平均值

.rolling(w).var()? ? ? ? ? ? ? ? ? ? 依次計算相鄰w個元素的方差

.rolling(w).std()? ? ? ? ? ? ? ???? 依次計算相鄰w個元素的標準差

.rolling(w).min() ? .max()? ? ? ? ? ? ? ? 依次計算相鄰w個元素的最小值和最大值

數(shù)據(jù)的相關(guān)分析

兩個事物树绩,表示為x和y,如何判斷它們之間的存在相關(guān)性隐轩?

相關(guān)性

????????? 1.x增大饺饭,y增大,兩個變量正相關(guān)

????????? 2.x增大职车,y減小瘫俊,兩個變量負相關(guān)

????????? 3.x增大,y無視悴灵,兩個變量不相關(guān)


相關(guān)分析函數(shù)

適用于Series和DataFrame類型

.cov()??????????????? 計算協(xié)方差矩陣

.corr()???????????????? 計算相關(guān)系數(shù)矩陣扛芽,Pearson、Spearman积瞒、Kendall等系數(shù)



最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末川尖,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子茫孔,更是在濱河造成了極大的恐慌叮喳,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,681評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件银酬,死亡現(xiàn)場離奇詭異嘲更,居然都是意外死亡,警方通過查閱死者的電腦和手機揩瞪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,205評論 3 399
  • 文/潘曉璐 我一進店門赋朦,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人李破,你說我怎么就攤上這事宠哄。” “怎么了嗤攻?”我有些...
    開封第一講書人閱讀 169,421評論 0 362
  • 文/不壞的土叔 我叫張陵毛嫉,是天一觀的道長。 經(jīng)常有香客問我妇菱,道長承粤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,114評論 1 300
  • 正文 為了忘掉前任闯团,我火速辦了婚禮辛臊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘房交。我一直安慰自己彻舰,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 69,116評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著刃唤,像睡著了一般隔心。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上尚胞,一...
    開封第一講書人閱讀 52,713評論 1 312
  • 那天硬霍,我揣著相機與錄音,去河邊找鬼辐真。 笑死须尚,一個胖子當(dāng)著我的面吹牛崖堤,可吹牛的內(nèi)容都是我干的侍咱。 我是一名探鬼主播,決...
    沈念sama閱讀 41,170評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼密幔,長吁一口氣:“原來是場噩夢啊……” “哼楔脯!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起胯甩,我...
    開封第一講書人閱讀 40,116評論 0 277
  • 序言:老撾萬榮一對情侶失蹤昧廷,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后偎箫,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體木柬,經(jīng)...
    沈念sama閱讀 46,651評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,714評論 3 342
  • 正文 我和宋清朗相戀三年淹办,在試婚紗的時候發(fā)現(xiàn)自己被綠了眉枕。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,865評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡怜森,死狀恐怖速挑,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情副硅,我是刑警寧澤姥宝,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站恐疲,受9級特大地震影響腊满,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜培己,卻給世界環(huán)境...
    茶點故事閱讀 42,211評論 3 336
  • 文/蒙蒙 一碳蛋、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧漱凝,春花似錦疮蹦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,699評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽阵苇。三九已至,卻和暖如春感论,著一層夾襖步出監(jiān)牢的瞬間绅项,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,814評論 1 274
  • 我被黑心中介騙來泰國打工比肄, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留快耿,地道東北人。 一個月前我還...
    沈念sama閱讀 49,299評論 3 379
  • 正文 我出身青樓芳绩,卻偏偏與公主長得像掀亥,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子妥色,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,870評論 2 361

推薦閱讀更多精彩內(nèi)容