一、concat?“拼接”
df = pd.concat([df1, df2], axis = 0, ignore_index = False, join = "outer
axis:指的是拼接的方向溅潜。axis = 0指的是拼接行(向下拼接),axis = 1指的是拼接列(向右拼接)粗仓。
ignore_index: 指的是拼接后是否忽視原df各自的索引。比如借浊,假如我們按行拼接萝招,原來df1和df2中各有五條數據蚂斤,索引是0,1,2,3,4槐沼。
????ignore_index=False,那么拼接后df的索引就是0,1,2,3,4,0,1,2,3,4岗钩。
????ignore_index=True, 那么拼接后df的索引就是0,1,2,3,4,5,6,7...
join:表示“如何拼接”。其中师倔,outer表示取并集,inner表示取交集趋艘。
二、merge “合并”
df = pd.merge(left, right, on =["ID", "ID"])
# 實戰(zhàn)項目中瓷胧,同一個企業(yè)的數據依據 year 豎向排列棚愤,要改為橫向合并搓萧。
def merge_year(data):
????temp = pd.merge(data[data['year'] ==2016], data[data['year'] ==2017], on=["ID", "ID"], suffixes=['.1', '.2'])
????ret = pd.merge(data[data['year'] ==2015], temp, on=["ID", "ID"])
????return ret