一琅坡、Series
obj = pd.Series(index, values)
? ? ? ? ? ? ? ? ? ? ? ? =? ? 索引? +? 一維數(shù)組
? index對象不可修改
obj.reindex(index,methond,fill_value):創(chuàng)建一個適應(yīng)新索引的新對象。index:新索引散劫;methon:ffill/bfill前/后填充;fill_value:填充值
obj.isnull()荞驴、obj.notnull: 檢測缺失值
obj.dripna():去除缺失值
obj.fillna():填充缺失值
obj.map()
obj.replace(a,b):a替換為b
obj.value_counts():返回值出現(xiàn)的頻率
二、DataFrame
df = pd.DataFrame(data,columns,index)
=多列數(shù)組+列索引+行索引
df.ix[val1,val2]:同時選擇行和列。
df.apply(f):執(zhí)行自定義函數(shù)f
df.map(str.lower):轉(zhuǎn)為小寫
df.replace():
df.head()/.tail():前/后5行
df.fillna()
pd.merge(df1,df2,how,on):左右按索引合并df1,df2伟姐,左右拼接
pd.concat(s1,s2,s3):上下拼接s1,s2,s3
pd.get_dummies(df['key']):獨熱/啞變量
三、TimeSeries
pd.date_range(start,end,periods,freq,normalize,) normalize=True:時間規(guī)范化亿卤,轉(zhuǎn)為整點
pd.date_range("20190319","20190419")
默認(rèn)按天為間隔
pd.date_range(start="20190319",periods=31)
pd.date_range(end="20190419",periods=31)
ts.shift(n):沿著時間軸向(+)后或前(-)移數(shù)據(jù)
ts.resample(feq='M',how='mean'):重采樣
pd.rolling_mean(ts,10):十個數(shù)的平均值移動窗口