使用pandas進(jìn)行數(shù)據(jù)分析

由于numpy 對于元素類別的限制(必須得是同一類型元素)哨颂,因此在存儲多種類別信息時,就顯得有些捉襟見肘了相种。

pandas威恼,則應(yīng)運而生。其存儲數(shù)據(jù)格式寝并,非常類似于R中的data_frame箫措。

pandas

構(gòu)建dataframe

1)構(gòu)建字典example_dict,字典值為鍵信息所對應(yīng)的列表食茎。
2)將構(gòu)建的字典轉(zhuǎn)化為pandas包中的dataframe形式蒂破。example = pd.DataFrame(example_dict)牲蜀。
也可以通過導(dǎo)入外部文件的方式怪蔑,如example = pd.read_csv('example.csv')
3)若外部文件中不包含行注釋苞轿,可以為dataframe 構(gòu)建標(biāo)簽速警,example.index = row_labels咧最。若引入的文件本身包含row_labels蒙挑,則在導(dǎo)入文件時需要增加選項index_col = 0俯抖,否則pandas 會默認(rèn)為表格添加一行注釋颊糜。

import pandas as pd

# Build cars DataFrame
names = ['United States', 'Australia', 'Japan', 'India', 'Russia', 'Morocco', 'Egypt']
dr =  [True, False, False, False, True, True, True]
cpc = [809, 731, 588, 18, 200, 70, 45]
cars_dict = { 'country':names, 'drives_right':dr, 'cars_per_cap':cpc }
cars = pd.DataFrame(cars_dict)
print(cars)

# Definition of row_labels
row_labels = ['US', 'AUS', 'JPN', 'IN', 'RU', 'MOR', 'EG']

# Specify row labels of cars
cars.index = row_labels

# Print cars again
print(cars)

選擇dataframe 中的信息

data_frame[] 會生成一個panda_series 類型內(nèi)容拨与。
而如果想將結(jié)果返回為dataframe稻据,需要使用雙方括號,data_frame[[]]
data_frame 也是支持切片操作的捻悯,且行使用名稱匆赃,列使用且僅使用切片。

loc 與iloc

data_frame.loc[]今缚,通過向其中輸入列表算柳,[row_label_dict, col_label_dict],從而指定輸出選擇的行與列的信息姓言。

ilocloc 一樣瞬项,只不過由名稱選擇變成了位置選擇。

# Import cars data
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# Print out drives_right column as Series
print(cars.iloc[:, 2])

# Print out drives_right column as DataFrame
print(cars.iloc[:, [2]])

# Print out cars_per_cap and drives_right as DataFrame
print(cars.loc[:, ['cars_per_cap', 'drives_right']])

使用比較運算符進(jìn)行篩選

# Import cars data
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# Create car_maniac: observations that have a cars_per_cap over 500
cpc = cars['cars_per_cap']
many_cars = cpc > 500 # 返回布爾值
car_maniac = cars[many_cars] # 只返回True 的row

# Print car_maniac
print(car_maniac)
  • 還可以結(jié)合numpy 結(jié)合and, or, not 這些比較字符何荚,實現(xiàn)更高效的篩選囱淋。
# Import cars data
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# Import numpy, you'll need this
import numpy as np

# Create medium: observations with cars_per_cap between 100 and 500
medium = cars[np.logical_and(cars['cars_per_cap'] > 100, cars['cars_per_cap'] < 500)]


# Print medium
print(medium)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市餐塘,隨后出現(xiàn)的幾起案子妥衣,更是在濱河造成了極大的恐慌,老刑警劉巖戒傻,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件称鳞,死亡現(xiàn)場離奇詭異,居然都是意外死亡稠鼻,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門狂票,熙熙樓的掌柜王于貴愁眉苦臉地迎上來候齿,“玉大人,你說我怎么就攤上這事闺属』哦ⅲ” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵掂器,是天一觀的道長亚皂。 經(jīng)常有香客問我,道長国瓮,這世上最難降的妖魔是什么灭必? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮乃摹,結(jié)果婚禮上禁漓,老公的妹妹穿的比我還像新娘。我一直安慰自己孵睬,他們只是感情好播歼,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著掰读,像睡著了一般秘狞。 火紅的嫁衣襯著肌膚如雪叭莫。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天烁试,我揣著相機(jī)與錄音雇初,去河邊找鬼。 笑死廓潜,一個胖子當(dāng)著我的面吹牛抵皱,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播辩蛋,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼呻畸,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了悼院?” 一聲冷哼從身側(cè)響起伤为,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎据途,沒想到半個月后绞愚,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡颖医,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年位衩,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片熔萧。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡糖驴,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出佛致,到底是詐尸還是另有隱情贮缕,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布俺榆,位于F島的核電站感昼,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏罐脊。R本人自食惡果不足惜定嗓,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望萍桌。 院中可真熱鬧蜕乡,春花似錦、人聲如沸梗夸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至辛块,卻和暖如春畔派,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背润绵。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工线椰, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人尘盼。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓憨愉,卻偏偏與公主長得像,于是被迫代替她去往敵國和親卿捎。 傳聞我的和親對象是個殘疾皇子配紫,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345