pandas 入門(mén)

Pandas 概述

Pandas 包含的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)處理工具的設(shè)計(jì)使得在Python中進(jìn)行數(shù)據(jù)清洗和分析非衬阆遥快捷惊豺,Pandas經(jīng)常和其他數(shù)值工具一起使用比如Numpy和Scipy,以及數(shù)據(jù)可視化工具matplotlib一起使用禽作。
盡管Pandas采用了很多Numpy的代碼風(fēng)格尸昧,但最大的不同在于Pandas 是用來(lái)處理表格型或異質(zhì)型數(shù)據(jù)的嗎,而Numpy則相反旷偿,它更適合用來(lái)處理同質(zhì)型的數(shù)值類數(shù)據(jù)烹俗。
在下面的介紹中我們會(huì)用下面的方式去引入Pandas:

In [1]: import pandas as pd

Pandas 數(shù)據(jù)結(jié)構(gòu)介紹

要使用Pandas爆侣,你首先就得熟悉它的兩個(gè)主要數(shù)據(jù)結(jié)構(gòu):Series和DataFrame。雖然它們并不能解決所有問(wèn)題幢妄,但它們?yōu)榇蠖鄶?shù)應(yīng)用提供了一種可靠的兔仰、易于使用的基礎(chǔ)。

Series

Series是一種類似于一維數(shù)組的對(duì)象蕉鸳,它由一組數(shù)據(jù)(各種NumPy數(shù)據(jù)類型)以及一組與之相關(guān)的數(shù)據(jù)標(biāo)簽(即索引)組成乎赴。僅由一組數(shù)據(jù)即可產(chǎn)生最簡(jiǎn)單的Series:

In [2]: s1 = pd.Series([9,8,7,6])
out [2]: 0    9
         1    8
         2    7
         3    6
         dtype: int64

Series的字符串表現(xiàn)形式為:索引在左邊,值在右邊潮尝。我們沒(méi)有為數(shù)據(jù)指定索引榕吼,于是會(huì)自動(dòng)創(chuàng)建一個(gè)0到N-1(N為數(shù)據(jù)的長(zhǎng)度)的整數(shù)型索引。你可以通過(guò)Series的values和index屬性獲取其數(shù)組表示形式和索引對(duì)象:

In[3]: s1.values
out[3]: array([9,8,7,6],dtype=int64)
In[4]: s1.index
out[4]: RangeIndex(start=0, stop=4, step=1)

我們也可以創(chuàng)建一個(gè)索引序列勉失,用標(biāo)簽標(biāo)識(shí)每個(gè)數(shù)據(jù)點(diǎn):

In[5]: s2 = pd.Series([9,8,7,6],index = ['d','c','b','a'])
In[6]: s2
out[6]: d    9
        c    8
        b    7
        a    6
        dtype: int64

接下來(lái)我們就可以用數(shù)據(jù)標(biāo)簽進(jìn)行索引

In[7]: s2['a']
out[7]: 6

我們從另一個(gè)角度考慮Series可以把它看做是一個(gè)長(zhǎng)度固定且有序的字典羹蚣。
如果我們已經(jīng)有一個(gè)字典,我們可以用字典生成一個(gè)Series:

In[8]: d = {'apple':2,'orange':5,'pear':6}
In[9]: s3 = pd.Series(d)
In[10]: s3
out[10]: apple     2
         orange    5
         pear      6
         dtype: int64

Pandas中使用isnull 和notnull 來(lái)檢查缺失數(shù)據(jù)乱凿。
我們知道在字典中的元素是無(wú)序的顽素,那在將字典序列轉(zhuǎn)化為Series時(shí)是否也是無(wú)序的?Series提供了一種可以指定順序的方法徒蟆。

In[11]: stada = ['apple','banana','orange']
In[12]: s4 = pd.Series(d,index = stada)
In[13]: s4
out[13]:apple     2.0
        banana    NaN
        orange    5.0
        dtype: float64

在上面的測(cè)試過(guò)程中胁出,我們的字典里并沒(méi)有‘banana’這個(gè)鍵,也就沒(méi)有相應(yīng)的值后专,于是在轉(zhuǎn)化的過(guò)程中必然就不存在這樣的值划鸽,于是Pandas就用NaN來(lái)標(biāo)識(shí)缺失的值。下面我們就用isnull和notnull來(lái)檢查戚哎。

In[14]: pd.isnull(s4)
out[14]: apple     False
         banana     True
         orange    False
         dtype: bool
In[15]: pd.notnull(s4)
out[15]:apple      True
        banana    False
        orange     True
        dtype: bool

Series 對(duì)象自身和其索引都有name屬性:

In[16]: s3.name = 'price'
In[17]: s3.index.name = 'fruits'
In[18]: s3
out[18]:fruits
        apple     2
        orange    5
        pear      6
        Name: price, dtype: int64

Series的索引還可以通過(guò)按位置賦值的方式進(jìn)行改變裸诽。
更多精彩內(nèi)容,關(guān)注公眾號(hào)“神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)”查看型凳!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末丈冬,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子甘畅,更是在濱河造成了極大的恐慌埂蕊,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,525評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蓄氧,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡槐脏,警方通過(guò)查閱死者的電腦和手機(jī)喉童,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)啤握,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事畴蒲。” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,862評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵辽旋,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我檐迟,道長(zhǎng)补胚,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,728評(píng)論 1 294
  • 正文 為了忘掉前任追迟,我火速辦了婚禮溶其,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘敦间。我一直安慰自己瓶逃,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,743評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布廓块。 她就那樣靜靜地躺著厢绝,像睡著了一般。 火紅的嫁衣襯著肌膚如雪带猴。 梳的紋絲不亂的頭發(fā)上昔汉,一...
    開(kāi)封第一講書(shū)人閱讀 51,590評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音浓利,去河邊找鬼挤庇。 笑死钞速,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的嫡秕。 我是一名探鬼主播渴语,決...
    沈念sama閱讀 40,330評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼昆咽!你這毒婦竟也來(lái)了驾凶?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,244評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤掷酗,失蹤者是張志新(化名)和其女友劉穎调违,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體泻轰,經(jīng)...
    沈念sama閱讀 45,693評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡技肩,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,885評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了浮声。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片虚婿。...
    茶點(diǎn)故事閱讀 40,001評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖泳挥,靈堂內(nèi)的尸體忽然破棺而出然痊,到底是詐尸還是另有隱情,我是刑警寧澤屉符,帶...
    沈念sama閱讀 35,723評(píng)論 5 346
  • 正文 年R本政府宣布剧浸,位于F島的核電站,受9級(jí)特大地震影響矗钟,放射性物質(zhì)發(fā)生泄漏唆香。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,343評(píng)論 3 330
  • 文/蒙蒙 一吨艇、第九天 我趴在偏房一處隱蔽的房頂上張望袋马。 院中可真熱鬧,春花似錦秸应、人聲如沸虑凛。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,919評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)桑谍。三九已至,卻和暖如春祸挪,著一層夾襖步出監(jiān)牢的瞬間锣披,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,042評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留雹仿,地道東北人增热。 一個(gè)月前我還...
    沈念sama閱讀 48,191評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像胧辽,于是被迫代替她去往敵國(guó)和親峻仇。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,955評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 目錄: 5.1 pandas 的數(shù)據(jù)結(jié)構(gòu)介紹 5.1.1 Series 5.1.2 DataFrame 5.1.3...
    凌岸_ing閱讀 4,766評(píng)論 0 17
  • pandas是基于NumPy構(gòu)建的,含有使數(shù)據(jù)分析工作變得更快更簡(jiǎn)單的高級(jí)數(shù)據(jù)結(jié)構(gòu)和操作工具人断。 pandas的數(shù)據(jù)...
    WeirdoSu閱讀 822評(píng)論 0 1
  • 功能包括但不限于: 1.按軸自動(dòng)或顯式數(shù)據(jù)對(duì)齊功能的數(shù)據(jù)結(jié)構(gòu)2.集成時(shí)間序列功能3.數(shù)學(xué)運(yùn)算和約簡(jiǎn)4.靈活處理缺失...
    Shinichi新一君閱讀 688評(píng)論 0 1
  • 寫(xiě)在前面的話 在做天文數(shù)據(jù)處理的過(guò)程中吭从,基本上是和類表格數(shù)據(jù)打交道,因此在處理天文數(shù)據(jù)的過(guò)程中pandas就是自己...
    YuAllon閱讀 1,068評(píng)論 0 3
  • 以下內(nèi)容主要學(xué)習(xí)自《利用Python進(jìn)行數(shù)據(jù)分析》 第5章 Pandas入門(mén)(1) pandas所包含的數(shù)據(jù)結(jié)構(gòu)和...
    whybask閱讀 770評(píng)論 0 0