kaggle網(wǎng)站上的教程
https://www.kaggle.com/sohier/tutorial-accessing-data-with-pandas/notebook
準(zhǔn)備工作:
1、下載數(shù)據(jù)
2疾渴、安裝juypter notebook
第一部分 索引
1朋譬、讀取數(shù)據(jù)并展示前三行數(shù)據(jù)(代碼在原網(wǎng)站都有程帕,這里不單獨(dú)放了)
2、索引:單行數(shù)據(jù)
方法一:最簡單的方法是.iloc辕狰,和列表的索引一樣,第一行的索引是0
方法二:用.loc方法,針對上面自定義的索引列Park Code
注意點(diǎn):
3腻贰、索引:多行數(shù)據(jù)
如果要獲得多行數(shù)據(jù),可以傳入多個(gè)索引值扒秸,但是要注意的是播演,獲取數(shù)據(jù)的順序與索引值的順序相同。
方法一:.iloc
方法二:.loc
方法三:和列表一樣對數(shù)據(jù)進(jìn)行切片
4伴奥、索引:列
方法一:列名作為索引
方法二:把列名作為dataframe的一個(gè)屬性處理
這種方法要保證列名中沒有空格写烤,僅使用基本字符,并且不與dataframe方法重名拾徙。
為使方法二更加通用洲炊,我們可以對列名進(jìn)行統(tǒng)一處理。把空格用“_”代替暂衡,因?yàn)镻andas區(qū)分大小寫询微,所以名稱也應(yīng)轉(zhuǎn)換為小寫。
5撑毛、索引:行列
6、索引:單個(gè)值
注意點(diǎn):若傳入值改為[1]萨驶,則返回結(jié)果也改變
第二部分:篩選
用pandas對數(shù)據(jù)進(jìn)行篩選時(shí)所用的方法是布爾索引
1腔呜、篩選state為'UT'的數(shù)據(jù)
2叁温、邏輯運(yùn)算符
~ 表示否定
| 表示或
& 表示與
篩選緯度大于60或面積大于10^6的公園
篩選時(shí)可以使用更復(fù)雜的表達(dá)式,包括lambda函數(shù)
例:篩選名稱由四個(gè)單詞構(gòu)成的公園
3核畴、isin 和 isnull
篩選位于ME膝但、TX、UT這三個(gè)州的公園
head()默認(rèn)顯示前5行