科學(xué)計(jì)算庫(2)——pandas構(gòu)建與計(jì)算

前言:
pandas是在numpy的基礎(chǔ)上開發(fā)出來的,Pandas 的數(shù)據(jù)結(jié)構(gòu):Pandas 主要有 Series(一維數(shù)組)盖桥,DataFrame(二維數(shù)組),Panel(三維數(shù)組)题翻,Panel4D(四維數(shù)組)揩徊,PanelND(更多維數(shù)組)等數(shù)據(jù)結(jié)構(gòu)。其中 Series 和 DataFrame 應(yīng)用的最為廣泛嵌赠。

Series

  • 何為Series靴拱?

Series由一組數(shù)據(jù)(numpy的ndarray)和一組與之相對應(yīng)的標(biāo)簽構(gòu)成

  • 創(chuàng)建Series

from pandas import Series,DataFrame
import pandas as pd
#直接構(gòu)建
ser01=Series([1,2,3],index=['a','b','c'])
#通過字典的形式創(chuàng)建
ser02=pd.Series({'a':1,'b':2,'c':3})
  • 索引切片

ser02[0:2]
ser01["n"]
  • 運(yùn)算

  • 類似ndarray運(yùn)算
print(ser01[ser01>=2])#求范圍(注意輸出值用中括號括起來)
print(ser01>=2)#返回的是布爾值
ser01+10#求整體加10
np.exp(ser01)#求指數(shù)
np.fabs(ser01)#求絕對值
#把相同的index相加,自動(dòng)對齊
ser03=Series([1,2,3,4],index=['a','b','c','d'])
ser02+ser03
  • 另外猾普,用API計(jì)算的方法
>1..加法
s1.add(s2)

>2.減法
>s1.sub(s2)

>3.乘法
>s1.mul(s2)

>4.除法
>s1.div(s2)

>5.求中位數(shù)
>s1.median()

>6.求最大值
>s1.max()

>7.求和
>s1.sum()
  • 缺失值處理

ser02=Series(ser01,index=['a','b','c','d'])
pd.isnull(ser02)#判斷是否為空值
ser02
#過濾掉np.nan的值
ser02[pd.notnull(ser02)]

DataFrame

  • 何為DataFrame?

DataFrame表格樣的數(shù)據(jù)結(jié)構(gòu)本谜,包含一組有序的列初家,有行、列索引,可以看做是Series的字典組成

  • 創(chuàng)建DataFrame

df01 =DataFrame([['susan','long','meimei'],[50,60,60]],index=['姓名','成績'],columns=['Chinese','math','english'])
df01  #index為行索引溜在,columns為列索引
image.png
 #用字典創(chuàng)建一個(gè)列表,
dict={
    "apart":[121,111,144,122],
    "year":[2011,2013,2022,2003],
    "month":8,
    "profit":[100,22,99,80]
}
df02=DataFrame(dict,index=['one','two','three','four'])
df02
image.png
  • 通過行列數(shù)據(jù)獲取

默認(rèn)為列獲取陌知,如果獲取行可用pd.loc()

df02['apart']
#列增加
df02['address']=['北京','shanghai','shuangzhou','shenzhen']
df02
#列刪除
df02.pop('apart')
#列修改
df02['month']=3
#行操作
df02.loc['two']
  • 讀取文件

分別讀取csv、excel掖肋、txt文件
df04=pd.read_csv('data.csv')
df05=pd.read_excel('data.xlsx')#excel
df03 = pd.read_csv("data.txt",sep="\t",header=None)#通過tab鍵分割數(shù)據(jù)
  • 過濾切片

df02[df02.columns[1:]]#截取從第二列之后所有行的值
image.png
  • 缺失值操作

和series類似

df04.isnull()
#刪除缺失值
df04.dropna(axis=1)#axis=1為去一列仆葡,默認(rèn)為去一行,注意和數(shù)學(xué)統(tǒng)計(jì)里面默認(rèn)計(jì)算的列不一樣
df04.dropna(how="all")
#替換缺失值
df04.fillna(0)
df04.fillna({0:1,1:2,2:3})
  • 數(shù)學(xué)統(tǒng)計(jì)

常見的方法如count describe min/max idxmin志笼、idxmax quantile sum mean median mad var std cumsum pct_change

df02.describe()
df1=df02.dropna(axis=1)
df02.quantile(0.25)#計(jì)算樣本分位(0到1)
df02.median()#中位數(shù)
df02.pct_change()#計(jì)算百分比變化
  • 協(xié)方差和相對系數(shù)

直觀反應(yīng)兩組數(shù)據(jù)的相關(guān)程度分別為cov沿盅,corr

df2=DataFrame({
    "gdp":[2,4,6],
    "chukou":[3,2,1]
})
df2.cov()
df2.corr()
  • 唯一值,值計(jì)數(shù)纫溃,成員資格

唯一值unique腰涧,值計(jì)數(shù)value_counts,成員資格isin(等于用沒里面的元素來過濾)

df3=Series([12,13,14,15,13,13,12,11,14])
df3.unique()
df3.value_counts()
df3[df3.isin([14,15])]#成員資格
  • 層次索引

索引可以大于一維紊浩,unstack(level=1)可把series轉(zhuǎn)化為dataframe窖铡,swapleve轉(zhuǎn)換索引
df.set_index([])

后記:
才疏學(xué)淺,慢慢學(xué)習(xí)坊谁,慢慢更新费彼,與諸君共勉

你可能感冒的文章:
我的機(jī)器學(xué)習(xí)numpy篇
我的機(jī)器學(xué)習(xí)matplotlib篇
我的機(jī)器學(xué)習(xí)微積分篇

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市口芍,隨后出現(xiàn)的幾起案子箍铲,更是在濱河造成了極大的恐慌,老刑警劉巖阶界,帶你破解...
    沈念sama閱讀 216,997評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件虹钮,死亡現(xiàn)場離奇詭異,居然都是意外死亡膘融,警方通過查閱死者的電腦和手機(jī)芙粱,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,603評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來氧映,“玉大人春畔,你說我怎么就攤上這事〉憾迹” “怎么了律姨?”我有些...
    開封第一講書人閱讀 163,359評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長臼疫。 經(jīng)常有香客問我择份,道長,這世上最難降的妖魔是什么烫堤? 我笑而不...
    開封第一講書人閱讀 58,309評論 1 292
  • 正文 為了忘掉前任荣赶,我火速辦了婚禮凤价,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘拔创。我一直安慰自己利诺,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,346評論 6 390
  • 文/花漫 我一把揭開白布剩燥。 她就那樣靜靜地躺著慢逾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪灭红。 梳的紋絲不亂的頭發(fā)上侣滩,一...
    開封第一講書人閱讀 51,258評論 1 300
  • 那天,我揣著相機(jī)與錄音比伏,去河邊找鬼胜卤。 笑死,一個(gè)胖子當(dāng)著我的面吹牛赁项,可吹牛的內(nèi)容都是我干的葛躏。 我是一名探鬼主播,決...
    沈念sama閱讀 40,122評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼悠菜,長吁一口氣:“原來是場噩夢啊……” “哼舰攒!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起悔醋,我...
    開封第一講書人閱讀 38,970評論 0 275
  • 序言:老撾萬榮一對情侶失蹤摩窃,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后芬骄,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體猾愿,經(jīng)...
    沈念sama閱讀 45,403評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,596評論 3 334
  • 正文 我和宋清朗相戀三年账阻,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蒂秘。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,769評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡淘太,死狀恐怖姻僧,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蒲牧,我是刑警寧澤撇贺,帶...
    沈念sama閱讀 35,464評論 5 344
  • 正文 年R本政府宣布,位于F島的核電站冰抢,受9級特大地震影響松嘶,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜挎扰,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,075評論 3 327
  • 文/蒙蒙 一翠订、第九天 我趴在偏房一處隱蔽的房頂上張望缓升。 院中可真熱鬧,春花似錦蕴轨、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,705評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至燥狰,卻和暖如春棘脐,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背龙致。 一陣腳步聲響...
    開封第一講書人閱讀 32,848評論 1 269
  • 我被黑心中介騙來泰國打工蛀缝, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人目代。 一個(gè)月前我還...
    沈念sama閱讀 47,831評論 2 370
  • 正文 我出身青樓屈梁,卻偏偏與公主長得像,于是被迫代替她去往敵國和親榛了。 傳聞我的和親對象是個(gè)殘疾皇子在讶,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,678評論 2 354

推薦閱讀更多精彩內(nèi)容