數(shù)據(jù)關(guān)聯(lián):pd.merge 和mysql的左右連接有點(diǎn)像
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,
left_index=False, right_index=False, sort=True,
suffixes=('_x', '_y'), copy=True, indicator=False,
validate=None)
參數(shù)理解:
- left 左表
- right 右表
- how 怎么連接的埠况,左右內(nèi)外垮媒?‘left’, ‘right’, ‘outer’, ‘inner’. 默認(rèn)inner庐完。inner是取交集INNER JOIN ,outer取并集FULL OUTER JOIN
- on 基于哪個(gè)字段連接的-沒有匹配到的值會(huì)NaN
- left_on right_on左右名字不一樣時(shí)用
- indicator=True 會(huì)告訴你是左邊有還是右邊有值
- sort=True 對(duì)鏈接的鍵值進(jìn)行排序
數(shù)據(jù)拼接:pd.concat
concat 可以橫向腹侣、縱向拼接谒拴,又起到關(guān)聯(lián)的作用
concat 可以同時(shí)處理多個(gè)數(shù)據(jù)框DataFrame,而 merge 只能同時(shí)處理 2 個(gè)數(shù)據(jù)框
df.iterrows 可以返回所有的行索引啸驯,以及該行的所有內(nèi)容
Python函數(shù)之iterrows, iteritems, itertuples對(duì)dataframe進(jìn)行遍歷
iterrows(): 將DataFrame迭代為(insex, Series)對(duì)客扎。
iteritems(): 將DataFrame迭代為(列名, Series)對(duì)
itertuples(): 將DataFrame迭代為元祖。