1. 把匯總表里的數(shù)據(jù)轉(zhuǎn)換成百分比(最后一行)
def perc_convert(ser):
return ser/float(ser[-1])
2. 【DataFrame】把str的日期列轉(zhuǎn)化為datetime
#方法一:parse()
f = lambda x:parse(x) if x!= 'null' else np.nan
data['first_visit_date'] = data['first_visit_date'].apply(f)
#方法二:pd.to_datetime()
pd.to_datetime(data['first_visit_date'] )
#另外秒梅,把yyyymmdd格式轉(zhuǎn)換成yyyy-mm-dd:
def date_convert(ser):
if type(ser) ==float:
ser = str(ser)
return str(ser[0:4])+'-'+str(ser[4:6])+'-'+str(ser[6:8])
else:return ser
3 . np.random模塊函數(shù)
參考原文:http://www.mamicode.com/info-detail-507676.html
np.random.randint(0,4,1000) :
生成由整數(shù)構(gòu)成,最小為0,最大值為4 ,長(zhǎng)度為1000的ndarray數(shù)組;
np.random.rand(10,5) :
生成10×5的隨機(jī)數(shù)組抖剿,隨機(jī)樣本位于[0, 1)中;
numpy.random.randn(10,5):
生成10×5的隨機(jī)數(shù)組,是從標(biāo)準(zhǔn)正態(tài)分布中返回一個(gè)或多個(gè)樣本值片吊;
uniform([low, high, size]):
生成一個(gè)均勻分布的數(shù)組,可指定最小值协屡,最大值俏脊,數(shù)組大小肤晓;