清洗數(shù)據(jù),把文件中的ordertime- 2019-1-1~2019-1-31 數(shù)據(jù)截取出來
import pandas as pd
df = pd.read_excel('ordermonth2019.xlsx',index_col='id')
#1.引入時間模塊, 確定周期時間
import datetime
startTime = datetime.datetime(2019, 1, 1)
endTime = datetime.datetime(2019, 1, 31, 23, 59, 59)
#2.將數(shù)據(jù)源中的時間數(shù)據(jù)轉換成datetime形式
df.orderTime = pd.to_datetime(df.orderTime)
df.payTime = pd.to_datetime(df.payTime)
#3.將2019年1月1日前數(shù)據(jù)刪除
index=df[df.orderTime < startTime].index
df.drop(index, inplace=True)
#4.將2019年1月31日后數(shù)據(jù)刪除
df[df.orderTime > endTime]
df.drop(index=df[df.orderTime > endTime].index, inplace=True)
第四步 會報錯,見下
TypeError: drop() got an unexpected keyword argument 'index'
見第三步解決
import pandas as pd
df = pd.read_excel('ordermonth2019.xlsx',index_col='id')
#1.引入時間模塊, 確定周期時間
import datetime
startTime = datetime.datetime(2019, 1, 1)
endTime = datetime.datetime(2019, 1, 31, 23, 59, 59)
#2.將數(shù)據(jù)源中的時間數(shù)據(jù)轉換成datetime形式
df.orderTime = pd.to_datetime(df.orderTime)
df.payTime = pd.to_datetime(df.payTime)
#3.將2019年1月1日前數(shù)據(jù)刪除
index=df[df.orderTime < startTime].index
df.drop(index, inplace=True)
#4.將2019年1月31日后數(shù)據(jù)刪除
df[df.orderTime > endTime]
index=df[df.orderTime > endTime].index
df.drop(index, inplace=True)