pandas基本功能

這一次要和大家分享的是Pandas的基本功能徘意。我們將了解與Series或DataFrame中數(shù)據(jù)交互的基礎(chǔ)機制汁雷。

重建索引

reindex 是re-index 的合成净嘀,這樣我們就可以很好地理解reindex這個方法的功能了!沒錯侠讯,就是創(chuàng)建一個符合新索引的新對象挖藏。我們用例子來說明這個方法。

In[1]:import pandas as pd 
In[2]:s1= pd.Series([1,3,5,7],['d','b','a','c'])
In[3]:s1
out[3]:d    1
       b    3
       a    5
       c    7
       dtype: int64

現(xiàn)在我們調(diào)用reindex方法:


In[4]:s2 = s1.reindex(['a','b','c','d'])
In[5}:s2
out[5]: a    5
        b    3
        c    7
        d    1
        dtype: int64

如果我們在重建索引的過程中厢漩,引入了之前并不存在的索引膜眠,則會引入缺失值:


In[6]:s3 = s1.reindex(['a','b','c','d','e'])
In[7]:s3
out[7]:a    5.0
       b    3.0
       c    7.0
       d    1.0
       e    NaN
       dtype: float64

在s3重建索引的過程中,我們引入了之前沒有的索引‘e’溜嗜,我們可以看到宵膨,s3中引入了缺失值NaN.

對于一些順序數(shù)據(jù),例如時間序列數(shù)據(jù)炸宵,我們在重新構(gòu)建順序的時候柄驻,可能會需要進行插值或填充,那么我們怎么處理這樣的問題呢焙压?如果我們直接指定新的索引鸿脓,然后對新的索引進行賦值,這樣不失為一種解決辦法涯曲。我們以s3為例野哭。


In[8]:s3['e'] = 9
In[9]:s3
out[9]:a    5.0
       b    3.0
       c    7.0
       d    1.0
       e    9.0
       dtype: float64

但還有沒其他方法呢?我們可以用一個常量來填充缺失值幻件,這時可以使用fillna方法拨黔。

In[10]:s3.fillna(11)
In[11]:s3
out[11]:a    5.0
        b    3.0
        c    7.0
        d    1.0
        e    9.0
        dtype: float64

請仔細觀察下面的結(jié)果哦安寺!

In[12]:s4 = s1.reindex(['a','b','c','d','e','f'])
In[13]:s4
out[13]:
a    5.0
b    3.0
c    7.0
d    1.0
e    NaN
f    NaN
dtype: float64
In[14]:s4.fillna(11)
In[15]:s4
out[15]:
a     5.0
b     3.0
c     7.0
d     1.0
e    11.0
f    11.0
dtype: float64

我們發(fā)現(xiàn)兩個缺失值都被填充成了我們所填充的常數(shù)魂奥,于是我們就歸納出fillna方法的作用——對所有缺失值進行填充昔期。但填充的結(jié)果取決于我們指定的數(shù)字敢会。


In[16]:s4.fillna(11.13)
In[17]:s4
out[17]:
a     5.00
b     3.00
c     7.00
d     1.00
e    11.13
f    11.13
dtype: float64

可以看到我們指定不同的數(shù)字,那么fillna按順序?qū)θ笔е颠M行填充园欣。

我們還可以用原有數(shù)據(jù)進行填充锭汛。


In[18]:s5 = s1.reindex(['a', 'e', 'b', 'f', 'c', 'd'])
In[19]:s5
out[19]:
a    5.0
e    NaN
b    3.0
f    NaN
c    7.0
d    1.0
dtype: float64
In[20]:s5.fillna(method='ffill')#向前填充
In[21]:s5.fillna(method = 'bfill')#向后填充

image

我們看到昵慌,e和f的缺失值都分別用它們前面的數(shù)字填充了秃臣!

image

我們看到涧衙,e和f的缺失值都分別用它們后面的數(shù)字填充了哪工!

關(guān)注公眾號“神經(jīng)網(wǎng)絡(luò)與深度學習”獲取更多精彩內(nèi)容!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末弧哎,一起剝皮案震驚了整個濱河市雁比,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌撤嫩,老刑警劉巖偎捎,帶你破解...
    沈念sama閱讀 218,607評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異序攘,居然都是意外死亡茴她,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,239評論 3 395
  • 文/潘曉璐 我一進店門两踏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來败京,“玉大人兜喻,你說我怎么就攤上這事梦染。” “怎么了朴皆?”我有些...
    開封第一講書人閱讀 164,960評論 0 355
  • 文/不壞的土叔 我叫張陵帕识,是天一觀的道長。 經(jīng)常有香客問我遂铡,道長肮疗,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,750評論 1 294
  • 正文 為了忘掉前任扒接,我火速辦了婚禮伪货,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘钾怔。我一直安慰自己碱呼,他們只是感情好,可當我...
    茶點故事閱讀 67,764評論 6 392
  • 文/花漫 我一把揭開白布宗侦。 她就那樣靜靜地躺著愚臀,像睡著了一般。 火紅的嫁衣襯著肌膚如雪矾利。 梳的紋絲不亂的頭發(fā)上姑裂,一...
    開封第一講書人閱讀 51,604評論 1 305
  • 那天,我揣著相機與錄音男旗,去河邊找鬼舶斧。 笑死,一個胖子當著我的面吹牛察皇,可吹牛的內(nèi)容都是我干的捧毛。 我是一名探鬼主播,決...
    沈念sama閱讀 40,347評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼呀忧!你這毒婦竟也來了师痕?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,253評論 0 276
  • 序言:老撾萬榮一對情侶失蹤而账,失蹤者是張志新(化名)和其女友劉穎胰坟,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體泞辐,經(jīng)...
    沈念sama閱讀 45,702評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡笔横,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,893評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了咐吼。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片吹缔。...
    茶點故事閱讀 40,015評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖锯茄,靈堂內(nèi)的尸體忽然破棺而出厢塘,到底是詐尸還是另有隱情,我是刑警寧澤肌幽,帶...
    沈念sama閱讀 35,734評論 5 346
  • 正文 年R本政府宣布晚碾,位于F島的核電站,受9級特大地震影響喂急,放射性物質(zhì)發(fā)生泄漏格嘁。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,352評論 3 330
  • 文/蒙蒙 一廊移、第九天 我趴在偏房一處隱蔽的房頂上張望糕簿。 院中可真熱鬧,春花似錦狡孔、人聲如沸懂诗。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,934評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽响禽。三九已至,卻和暖如春荚醒,著一層夾襖步出監(jiān)牢的瞬間芋类,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,052評論 1 270
  • 我被黑心中介騙來泰國打工界阁, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留侯繁,地道東北人。 一個月前我還...
    沈念sama閱讀 48,216評論 3 371
  • 正文 我出身青樓泡躯,卻偏偏與公主長得像贮竟,于是被迫代替她去往敵國和親丽焊。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,969評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 重建索引 reindex用于創(chuàng)建一個符合新索引的對象咕别,如果某個索引值之前不存在技健,則引入缺失值 為解決缺失值問題,使...
    w未然閱讀 328評論 0 0
  • 1.Pandas基本數(shù)據(jù)結(jié)構(gòu) Pandas兩種常用的數(shù)據(jù)結(jié)構(gòu):Series 和 DataFrame惰拱。其中Serie...
    長歌行夜一閱讀 158評論 0 0
  • Series和DataFrame的基本操作雌贱。 重新索引reindex。Series會根據(jù)索引進行重排偿短,如果某個索引...
    zhangxu0636閱讀 516評論 0 0
  • 3昔逗、索引降传、選取和過濾 4、算術(shù)運算和數(shù)據(jù)對齊 由上面可以看到勾怒,自動的數(shù)據(jù)對齊操作在不重疊的索引處引入NA值婆排。 從上...
    陳容喜閱讀 225評論 0 1
  • 在上面的例子中泽论,lambda作為一個表達式艾少,定義了一個匿名函數(shù)卡乾,上例的代碼x為入口參數(shù),x+1為函數(shù)體缚够。 排序和排...
    陳容喜閱讀 189評論 0 1