data.frame 實用方法
-
pd.read_csv
讀入文件作為data.frame
?header:指定是否有標題腺律,None無標題
?sep:指定文件分隔符 超級實用 -
df.shape
返回df的行數(shù)和列數(shù) 超級實用 -
df.columns
返回列名 -
df.info()
返回df各變量的信息 -
df["列名"]
選取某列數(shù)據(jù) -
df.describe()
返回數(shù)值類型列的描述性統(tǒng)計結(jié)果怠肋,包含均值未蝌、標準差嵌莉、范圍等掩幢。 -
df.head()
顯示數(shù)據(jù)前5行 超級實用 -
df.sort_values(by= , ascending=False)
按照by
指定列進行排序缤骨,默認為升序浮禾,使用ascending=False
改為降序交胚。 超級實用 -
df['列名'].mean
對任意一列計算均值 -
df['列名'].min
對任意一列計算最小值 -
df['列名'].max
對任意一列計算最大值 -
df['列名'].sum
對任意一列求和。盈电,此外蝴簇,可對bool行求和,以獲得True的個數(shù) -
df['列名'] == 1
索引匆帚,該列值是否等于1 熬词,返回True或False -
df[df['列名'] == 1]
返回符合索引條件的行,屬性依舊是data.frame。超級實用 -
df[(df['列名a'] == 1) & (df['列名b'] == 1)]
結(jié)合邏輯判斷使用多個索引條件互拾。超級實用
data.frame 子集提取命令 loc
, iloc
loc
為名稱索引歪今,iloc
為數(shù)字索引
-
df.loc['行名']
按行名提取子集 -
df.loc['行名','列名']
提取指定行,列的內(nèi)容 -
df.loc['行名','列名'] = 1
修改指定行颜矿,列內(nèi)容寄猩。取一行或一列時用列表。 -
df.iloc[0:2, 0:2]
提取前兩行骑疆、前兩列的內(nèi)容
使用哈希替換某列的值
map
d = {'No': False, 'Yes': True}
df['列名'] = df['列名'].map(d)
replace
d = {'No': False, 'Yes': True}
df = df.replace({'列名': d})