pandas dataFrame(數(shù)據(jù)框)是能夠有效表示csv文件內(nèi)容的一種數(shù)據(jù)格式琳水,它是允許每一列屬于不同類(lèi)型的二維數(shù)據(jù)結(jié)構(gòu)
類(lèi)似numpy的二維數(shù)組桐腌,pandas使用dataFrame去存儲(chǔ)二維數(shù)據(jù)摇邦,不同的是,它可以指定行和列的索引值index和columns≡可以使用dataFrame的data、index巫员、columns三個(gè)參數(shù)去聲明庶香,也可以類(lèi)似創(chuàng)建一個(gè)dict的方式去創(chuàng)建一個(gè)dataFrame
與series相同,dataFrame也有iloc(按照位置獲取對(duì)應(yīng)的值)和loc(按照索引index或columns獲取對(duì)應(yīng)的值)简识,iloc[0]獲取的是第一行的數(shù)據(jù)赶掖,iloc[0, 1]獲取的是第一行第二列的值。ridership_df.loc['05-01-11']獲取的是該天所對(duì)應(yīng)的一行5個(gè)車(chē)站的數(shù)據(jù)七扰,ridership_df.loc['R003']獲取的是該車(chē)站所對(duì)應(yīng)的一列所對(duì)應(yīng)的的數(shù)據(jù)奢赂,同樣ridership_df.loc['05-05-11', 'R003']獲取的是05-05-11那天R003車(chē)站的數(shù)據(jù)。
dataFrame的sum颈走、mean呈驶、max等函數(shù)是對(duì)每行或每列運(yùn)算的,使用axis控制疫鹊,默認(rèn)axis=0每行,axis=1則表示每列司致,若需要對(duì)整個(gè)數(shù)據(jù)運(yùn)算拆吆,可以使用ridership_df.values.mean()。values表示的是dataFrame的數(shù)據(jù)組成的numpy Array脂矫,可以用它來(lái)對(duì)所有數(shù)據(jù)進(jìn)行運(yùn)算?