一、pandas 是什么
pandas 是基于 NumPy 的一個 Python 數(shù)據(jù)分析包,主要目的是為了數(shù)據(jù)分析。它提供了大量高級的數(shù)據(jù)結(jié)構(gòu)和對數(shù)據(jù)處理的方法阎姥。
pandas 有兩個主要的數(shù)據(jù)結(jié)構(gòu):Series 和 DataFrame。
二鸽捻、Series
Series 是一個一維數(shù)組對象呼巴,類似于 NumPy 的一維 array。它除了包含一組數(shù)據(jù)還包含一組索引御蒲,所以可以把它理解為一組帶索引的數(shù)組衣赶。
將 Python 數(shù)組轉(zhuǎn)換成 Series 對象:
將 Python 字典轉(zhuǎn)換成 Series 對象:
當(dāng)沒有顯示指定索引的時候,Series 自動以 0 開始厚满,步長為 1 為數(shù)據(jù)創(chuàng)建索引府瞄。
你也可以通過 index 參數(shù)顯示指定索引:
對于 Series 對象里的單個數(shù)據(jù)來說,和普通數(shù)組一樣痰滋,根據(jù)索引獲取對應(yīng)的數(shù)據(jù)或重新賦值摘能;
不過你還可以傳入一個索引的數(shù)組來獲取數(shù)據(jù)或未數(shù)據(jù)重新賦值:
想要單獨獲取 Series 對象的索引或者數(shù)組內(nèi)容的時候续崖,可以使用 index 和 values 屬性敲街,例如:
對 Series 對象的運算(索引不變):
三、DataFrame
DataFrame 是一個表格型的數(shù)據(jù)結(jié)構(gòu)严望。它提供有序的列和不同類型的列值多艇。
例如將一個由 NumPy 數(shù)組組成的字典轉(zhuǎn)換成 DataFrame 對象:
DataFrame 默認(rèn)根據(jù)列名首字母順序進(jìn)行排序,想要指定列的順序像吻?傳入一個列名的字典即可:
如果傳入的列名找不到峻黍,它不會報錯复隆,而是產(chǎn)生一列 NA 值:
DataFrame 不僅可以以字典索引的方式獲取數(shù)據(jù),還可以以屬性的方法獲取姆涩,例如:
修改列的值:
刪除某一列: