科學(xué)計(jì)算庫(2)——pandas構(gòu)建與計(jì)算

前言：
pandas是在numpy的基礎(chǔ)上開發(fā)出來的，Pandas 的數(shù)據(jù)結(jié)構(gòu)：Pandas 主要有 Series（一維數(shù)組）盖桥，DataFrame（二維數(shù)組），Panel（三維數(shù)組）题翻，Panel4D（四維數(shù)組）揩徊，PanelND（更多維數(shù)組）等數(shù)據(jù)結(jié)構(gòu)。其中 Series 和 DataFrame 應(yīng)用的最為廣泛嵌赠。

Series

何為Series靴拱？

Series由一組數(shù)據(jù)（numpy的ndarray）和一組與之相對應(yīng)的標(biāo)簽構(gòu)成

創(chuàng)建Series

from pandas import Series,DataFrame
import pandas as pd
#直接構(gòu)建
ser01=Series([1,2,3],index=['a','b','c'])
#通過字典的形式創(chuàng)建
ser02=pd.Series({'a':1,'b':2,'c':3})

索引切片

ser02[0:2]
ser01["n"]

運(yùn)算
類似ndarray運(yùn)算

print(ser01[ser01>=2])#求范圍（注意輸出值用中括號括起來）
print(ser01>=2)#返回的是布爾值
ser01+10#求整體加10
np.exp(ser01)#求指數(shù)
np.fabs(ser01)#求絕對值
#把相同的index相加，自動(dòng)對齊
ser03=Series([1,2,3,4],index=['a','b','c','d'])
ser02+ser03

另外猾普，用API計(jì)算的方法

>1..加法
s1.add(s2)

>2.減法
>s1.sub(s2)

>3.乘法
>s1.mul(s2)

>4.除法
>s1.div(s2)

>5.求中位數(shù)
>s1.median()

>6.求最大值
>s1.max()

>7.求和
>s1.sum()

缺失值處理

ser02=Series(ser01,index=['a','b','c','d'])
pd.isnull(ser02)#判斷是否為空值
ser02
#過濾掉np.nan的值
ser02[pd.notnull(ser02)]

DataFrame

何為DataFrame？

DataFrame表格樣的數(shù)據(jù)結(jié)構(gòu)本谜，包含一組有序的列初家，有行、列索引，可以看做是Series的字典組成

創(chuàng)建DataFrame

df01 =DataFrame([['susan','long','meimei'],[50,60,60]],index=['姓名','成績'],columns=['Chinese','math','english'])
df01  #index為行索引溜在，columns為列索引

image.png

 #用字典創(chuàng)建一個(gè)列表,
dict={
    "apart":[121,111,144,122],
    "year":[2011,2013,2022,2003],
    "month":8,
    "profit":[100,22,99,80]
}
df02=DataFrame(dict,index=['one','two','three','four'])
df02

image.png

通過行列數(shù)據(jù)獲取

默認(rèn)為列獲取陌知，如果獲取行可用pd.loc()

df02['apart']
#列增加
df02['address']=['北京','shanghai','shuangzhou','shenzhen']
df02
#列刪除
df02.pop('apart')
#列修改
df02['month']=3
#行操作
df02.loc['two']

讀取文件

分別讀取csv、excel掖肋、txt文件
df04=pd.read_csv('data.csv')
df05=pd.read_excel('data.xlsx')#excel
df03 = pd.read_csv("data.txt",sep="\t",header=None)#通過tab鍵分割數(shù)據(jù)

過濾切片

df02[df02.columns[1:]]#截取從第二列之后所有行的值

image.png

缺失值操作

和series類似

df04.isnull()
#刪除缺失值
df04.dropna(axis=1)#axis=1為去一列仆葡，默認(rèn)為去一行，注意和數(shù)學(xué)統(tǒng)計(jì)里面默認(rèn)計(jì)算的列不一樣
df04.dropna(how="all")
#替換缺失值
df04.fillna(0)
df04.fillna({0:1,1:2,2:3})

數(shù)學(xué)統(tǒng)計(jì)

常見的方法如count describe min/max idxmin志笼、idxmax quantile sum mean median mad var std cumsum pct_change

df02.describe()
df1=df02.dropna(axis=1)
df02.quantile(0.25)#計(jì)算樣本分位（0到1）
df02.median()#中位數(shù)
df02.pct_change()#計(jì)算百分比變化

協(xié)方差和相對系數(shù)

直觀反應(yīng)兩組數(shù)據(jù)的相關(guān)程度分別為cov沿盅，corr

df2=DataFrame({
    "gdp":[2,4,6],
    "chukou":[3,2,1]
})
df2.cov()
df2.corr()

唯一值，值計(jì)數(shù)纫溃，成員資格

唯一值unique腰涧，值計(jì)數(shù)value_counts，成員資格isin（等于用沒里面的元素來過濾）

df3=Series([12,13,14,15,13,13,12,11,14])
df3.unique()
df3.value_counts()
df3[df3.isin([14,15])]#成員資格

層次索引

索引可以大于一維紊浩，unstack(level=1)可把series轉(zhuǎn)化為dataframe窖铡，swapleve轉(zhuǎn)換索引
df.set_index([])

后記：
才疏學(xué)淺，慢慢學(xué)習(xí)坊谁，慢慢更新费彼，與諸君共勉

你可能感冒的文章：
我的機(jī)器學(xué)習(xí)numpy篇
 我的機(jī)器學(xué)習(xí)matplotlib篇
 我的機(jī)器學(xué)習(xí)微積分篇

最后編輯于：2019.07.17 15:00:53

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市口芍，隨后出現(xiàn)的幾起案子箍铲，更是在濱河造成了極大的恐慌，老刑警劉巖阶界，帶你破解...
沈念sama閱讀 216,997評論 6贊 502
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件虹钮，死亡現(xiàn)場離奇詭異，居然都是意外死亡膘融，警方通過查閱死者的電腦和手機(jī)芙粱，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,603評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來氧映，“玉大人春畔，你說我怎么就攤上這事〉憾迹” “怎么了律姨？”我有些...
開封第一講書人閱讀 163,359評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長臼疫。經(jīng)常有香客問我择份，道長，這世上最難降的妖魔是什么烫堤？我笑而不...
開封第一講書人閱讀 58,309評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任荣赶，我火速辦了婚禮凤价，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘拔创。我一直安慰自己利诺，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,346評論 6贊 390
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布剩燥。她就那樣靜靜地躺著慢逾，像睡著了一般。火紅的嫁衣襯著肌膚如雪灭红。梳的紋絲不亂的頭發(fā)上侣滩，一...
開封第一講書人閱讀 51,258評論 1贊 300
城市分裂傳說
那天，我揣著相機(jī)與錄音比伏，去河邊找鬼胜卤。笑死，一個(gè)胖子當(dāng)著我的面吹牛赁项，可吹牛的內(nèi)容都是我干的葛躏。我是一名探鬼主播，決...
沈念sama閱讀 40,122評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼悠菜，長吁一口氣：“原來是場噩夢啊……” “哼舰攒！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起悔醋，我...
開封第一講書人閱讀 38,970評論 0贊 275
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤摩窃，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后芬骄，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體猾愿，經(jīng)...
沈念sama閱讀 45,403評論 1贊 313
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,596評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年账阻，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蒂秘。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,769評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡淘太，死狀恐怖姻僧，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情蒲牧，我是刑警寧澤撇贺，帶...
沈念sama閱讀 35,464評論 5贊 344
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站冰抢，受9級特大地震影響松嘶，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜挎扰，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,075評論 3贊 327
男人毒藥：我在死后第九天來索命
文/蒙蒙一翠订、第九天我趴在偏房一處隱蔽的房頂上張望缓升。院中可真熱鬧，春花似錦蕴轨、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,705評論 0贊 22
一樁弒父案橙弱，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至燥狰，卻和暖如春棘脐，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背龙致。一陣腳步聲響...
開封第一講書人閱讀 32,848評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工蛀缝，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人目代。一個(gè)月前我還...
沈念sama閱讀 47,831評論 2贊 370
代替公主和親
正文我出身青樓屈梁，卻偏偏與公主長得像，于是被迫代替她去往敵國和親榛了。傳聞我的和親對象是個(gè)殘疾皇子在讶，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,678評論 2贊 354

科學(xué)計(jì)算庫(2)——pandas構(gòu)建與計(jì)算

Series

何為Series靴拱？

創(chuàng)建Series

索引切片

運(yùn)算

缺失值處理

DataFrame

何為DataFrame？

創(chuàng)建DataFrame

通過行列數(shù)據(jù)獲取

讀取文件

過濾切片

缺失值操作

數(shù)學(xué)統(tǒng)計(jì)

協(xié)方差和相對系數(shù)

唯一值，值計(jì)數(shù)纫溃，成員資格

層次索引

推薦閱讀更多精彩內(nèi)容