Python數(shù)據(jù)處理中 pd.concat 與 pd.merge 區(qū)別

背景

數(shù)據(jù)的合并與關(guān)聯(lián)是數(shù)據(jù)處理過程中經(jīng)常遇到的問題最岗,在SQL、HQL中大家可能都有用到 join、uion all 等 包雀,在 Pandas 中也有同樣的功能,來滿足數(shù)據(jù)處理需求亲铡,個(gè)人感覺Pandas 處理數(shù)據(jù)還是非常方便才写,數(shù)據(jù)處理效率比較高葡兑,能滿足不同的業(yè)務(wù)需求

本篇文章主要介紹 Pandas 中的數(shù)據(jù)拼接與關(guān)聯(lián)

數(shù)據(jù)拼接---pd.concat

concat 是pandas級的函數(shù),用來拼接或合并數(shù)據(jù)赞草,其根據(jù)不同的軸既可以橫向拼接讹堤,又可以縱向拼接

函數(shù)參數(shù)

pd.concat(
    objs: 'Iterable[NDFrame] | Mapping[Hashable, NDFrame]',
    axis=0,
    join='outer',
    ignore_index: 'bool' = False,
    keys=None,
    levels=None,
    names=None,
    verify_integrity: 'bool' = False,
    sort: 'bool' = False,
    copy: 'bool' = True,
) -> 'FrameOrSeriesUnion'
  • objs:合并的數(shù)據(jù)集,一般用列表傳入房资,例如:[df1,df2,df3]
  • axis:指定數(shù)據(jù)拼接時(shí)的軸蜕劝,0是行,在行方向上拼接轰异;1是列岖沛,在列方向上拼接
  • join:拼接的方式有 inner,或者outer搭独,與sql中的意思一樣

以上三個(gè)參數(shù)在實(shí)際工作中經(jīng)常使用婴削,其他參數(shù)不再做介紹

案例:

模擬數(shù)據(jù)

  • 橫向拼接
    橫向拼接-1

    字段相同的列進(jìn)行堆疊,字段不同的列分列存放牙肝,缺失值用NAN來填充唉俗,下面對模擬數(shù)據(jù)進(jìn)行變換用相同的字段,進(jìn)行演示
橫向拼接-2
  • 縱向拼接
    縱向拼接

可以看出在縱向拼接的時(shí)候配椭,會(huì)按索引進(jìn)行關(guān)聯(lián)虫溜,使相同名字的成績放在一起,而不是簡單的堆疊

數(shù)據(jù)關(guān)聯(lián)---pd.merge

數(shù)據(jù)聯(lián)接股缸,與SQL中的join基本一樣衡楞,用來關(guān)聯(lián)不同的數(shù)據(jù)表,有左表敦姻、右表的區(qū)分瘾境,可以指定關(guān)聯(lián)的字段

函數(shù)參數(shù)

pd.merge(
    left: 'DataFrame | Series',
    right: 'DataFrame | Series',
    how: 'str' = 'inner',
    on: 'IndexLabel | None' = None,
    left_on: 'IndexLabel | None' = None,
    right_on: 'IndexLabel | None' = None,
    left_index: 'bool' = False,
    right_index: 'bool' = False,
    sort: 'bool' = False,
    suffixes: 'Suffixes' = ('_x', '_y'),
    copy: 'bool' = True,
    indicator: 'bool' = False,
    validate: 'str | None' = None,
) -> 'DataFrame'
  • left:左表
  • right:右表
  • how:關(guān)聯(lián)的方式,{'left', 'right', 'outer', 'inner', 'cross'}, 默認(rèn)關(guān)聯(lián)方式為 'inner'
  • on:關(guān)聯(lián)時(shí)指定的字段镰惦,兩個(gè)表共有的
  • left_on:關(guān)聯(lián)時(shí)用到左表中的字段迷守,在兩個(gè)表不共有關(guān)聯(lián)字段時(shí)使用
  • right_on:關(guān)聯(lián)時(shí)用到右表中的字段,在兩個(gè)表不共有關(guān)聯(lián)字段時(shí)使用

以上參數(shù)在實(shí)際工作中經(jīng)常使用旺入,其他參數(shù)不再做介紹

案例:

數(shù)據(jù)關(guān)聯(lián)

merge 的使用與SQL中的 join 很像兑凿,使用方式基本一致,既有內(nèi)連接茵瘾,也有外連接急膀,用起來基本沒有什么難度

兩者區(qū)別

  • concat 只是 pandas 下的方法,而 merge 即是 pandas 下的方法龄捡,又是DataFrame 下的方法
  • concat 可以橫向卓嫂、縱向拼接,又起到關(guān)聯(lián)的作用
  • merge 只能進(jìn)行關(guān)聯(lián)聘殖,也就是縱向拼接
  • concat 可以同時(shí)處理多個(gè)數(shù)據(jù)框DataFrame晨雳,而 merge 只能同時(shí)處理 2 個(gè)數(shù)據(jù)框

歷史相關(guān)文章


以上是自己實(shí)踐中遇到的一些問題,分享出來供大家參考學(xué)習(xí)餐禁,歡迎關(guān)注微信公眾號(hào):DataShare 血久,不定期分享干貨

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市帮非,隨后出現(xiàn)的幾起案子氧吐,更是在濱河造成了極大的恐慌,老刑警劉巖末盔,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件筑舅,死亡現(xiàn)場離奇詭異,居然都是意外死亡陨舱,警方通過查閱死者的電腦和手機(jī)翠拣,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來游盲,“玉大人误墓,你說我怎么就攤上這事∫娑校” “怎么了谜慌?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長莺奔。 經(jīng)常有香客問我欣范,道長,這世上最難降的妖魔是什么弊仪? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮杖刷,結(jié)果婚禮上励饵,老公的妹妹穿的比我還像新娘。我一直安慰自己滑燃,他們只是感情好役听,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著表窘,像睡著了一般典予。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上乐严,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天瘤袖,我揣著相機(jī)與錄音,去河邊找鬼昂验。 笑死捂敌,一個(gè)胖子當(dāng)著我的面吹牛艾扮,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播占婉,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼泡嘴,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了逆济?” 一聲冷哼從身側(cè)響起酌予,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎奖慌,沒想到半個(gè)月后抛虫,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡升薯,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年莱褒,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片涎劈。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡广凸,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出蛛枚,到底是詐尸還是另有隱情谅海,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布蹦浦,位于F島的核電站扭吁,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏盲镶。R本人自食惡果不足惜侥袜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望溉贿。 院中可真熱鬧枫吧,春花似錦、人聲如沸宇色。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽宣蠕。三九已至例隆,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間抢蚀,已是汗流浹背镀层。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留皿曲,地道東北人鹿响。 一個(gè)月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓羡微,卻偏偏與公主長得像,于是被迫代替她去往敵國和親惶我。 傳聞我的和親對象是個(gè)殘疾皇子妈倔,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345