1.用pandas進(jìn)行 one-hot編碼堪侯,pd.get_dummies()
2湾揽、Pandas 提供了一些選擇的方法茵瘾,這些選擇的方法可以把數(shù)據(jù)切片饵婆,也可以把數(shù)據(jù)切塊勺馆。下面我們簡單介紹一下:
? ? 查看一列的一些基本統(tǒng)計信息:data.columnname.describe()
? ? 選擇一列:data['columnname']
? ? 選擇一列的前幾行數(shù)據(jù):data['columnsname'][:n]
? ? 選擇多列:data[['column1','column2']]
? ? Where 條件過濾:data[data['columnname'] >condition]
3、python 常見的數(shù)據(jù)結(jié)構(gòu)之間的轉(zhuǎn)換:
? ? list? <--> np.array :? ? np.array(a)? ? ? a.tolist()
? ? list? <-->? pd.series? ? ? ? series = pd.Series(list)? ? ? ? ? ? list = series.tolist()
? ? list <-->? DataFrame? ? ? dataframe = pd.DataFrame(list)? ? list = dataframe.values.tolist()
? ? dict? -->? list? ? list= dict.values()? ? list* = dict.keys()? ?
? ? dict <--> Series? ? series = pd.Series(dict)? ? ? ? dict = series.to_dict()?
? ? dict? <-->? DataFrame? ? dataframe = pd.DataFrame(dict)? ? dict = dataframe.to_dict()
? ? np.array <--> Series? series = pd.Series(np.array)? ? np.array = series.values
? ? np.array <--> dataframe? dataframe= pd.Dataframe(np.array)? ? np.array = dataframe.values
? ? Series <--> DataFrame? dataframe =pd.Dataframe(series)? series? = dataframe[0]