17度陆、pandas的merge合并函數(shù)

在使用Excel時艾凯，我用的最多函數(shù)就是vlookup；在使用SQL查詢的時候懂傀，我用的最多應(yīng)該是join趾诗；這兩個都有相同的功能，將多表匹配蹬蚁、合并恃泪，然后達(dá)到對比、查漏等等效果犀斋。在pandas里面也有類似的功能函數(shù)就是pd.merge()（pd是指導(dǎo)入的pandas庫）贝乎。merge的用法跟SQL中join很像。

df1

df2

使用merge進(jìn)行合并：

使用merge進(jìn)行合并

基本的結(jié)構(gòu)為：pd.merge（df1叽粹，df2览效，合并方式，df1合并用的鍵虫几，df2合并用的鍵）锤灿。

后面兩個參數(shù)在合并的時候兩個表格使用的鍵的列名是一樣的時候可以改成on='title'：

on='title'

結(jié)果和第一種方式是一樣的。

使用合并的時候pandas會默認(rèn)只選取一個相同的鍵列名持钉，然后其它的數(shù)據(jù)進(jìn)行合并衡招。

注意到兩張表格中有一個location_road是共同具有的一個列，因此合并之后兩個表格的location_road列分別加上了_x和_y的后綴以便區(qū)分每强，這兩個后綴也可以修改的（使用suffixes函數(shù)進(jìn)行修改）：

使用suffixes函數(shù)修改后綴

merge函數(shù)還可以只取其中的某幾列數(shù)據(jù)進(jìn)行合并：

選擇某幾列進(jìn)行合并

選擇某幾列的時候需要注意的是如果使用on參數(shù)始腾，那么此參數(shù)指定的值兩個表格都要有州刽；還有一個非常重要的就是選擇多列的時候使用的是兩個中括號。

使用merge合并方式有left, inner, right浪箭，outer穗椅，通過how參數(shù)來指定。

how = 'inner'表示的是只合并兩個表格都具有的行奶栖；

how = 'left'表示的是合并之后顯示的是第一個表格里的所有行匹表；

how = 'left'

第一個表與合并之后的表對比

how = 'right'表示的是合并之后顯示的是第二個表格里所有的行；

how = 'right'

第二個表與合并之后的表對比

細(xì)心的人肯定會發(fā)現(xiàn)了宣鄙，為什么使用how = 'right'合并之后的行數(shù)不是等于第二個表的行數(shù)呢袍镀？這是因為在第一個表的title列中有一個重復(fù)值被計算進(jìn)去了，所有多了一行（關(guān)于重復(fù)值的去除方法可以參考duplicated那篇的內(nèi)容）冻晤。

how = 'outer'表示的是兩個表格里所有的行都進(jìn)行合并苇羡。

how = 'outer'

在使用left，right鼻弧，outer的時候會產(chǎn)生空值设江，只要在語句的后面加.fillna(o)就可以填充空值了。

填充空值之后的表格

這也是pandas很方便的一個特點(diǎn)：多個函數(shù)可以連在一起使用攘轩，只要用點(diǎn)連接起來就可以了叉存。

如果合并的時候要用索引作為鍵的話就不能用on，left_on和right_on了度帮，而是要使用left_index=True, right_index=True（也就是以索引為標(biāo)準(zhǔn)來進(jìn)行表聯(lián)結(jié)歼捏，而不是兩個表共同擁有的列）。

保留連接的列

因為是以索引作為聯(lián)結(jié)的笨篷，所以title不是對應(yīng)的甫菠，這個暫時還不清楚有什么比較好的應(yīng)用場景。

還有這個方法合并的時候是安裝鍵的順序進(jìn)行排列的冕屯，如果兩個表都很大的話合并時就會很慢寂诱，如果不需要排序就需要添加參數(shù)sort=False。

merge還有一個參數(shù)安聘，indicator=True痰洒，這個參數(shù)會添加一列用來注明每一行是來自于哪個表的：

使用indicator=True

以上所說的都是橫向合并，那么如果要進(jìn)行縱向合并要怎么操作呢浴韭？

merge()里并沒有axis=0這個參數(shù)丘喻，如果需要縱向匹配合并的話可以先將表格轉(zhuǎn)置（.T）之后再進(jìn)行合并。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末念颈，一起剝皮案震驚了整個濱河市泉粉，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖嗡靡，帶你破解...
沈念sama閱讀 218,607評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件跺撼，死亡現(xiàn)場離奇詭異，居然都是意外死亡讨彼，警方通過查閱死者的電腦和手機(jī)歉井，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,239評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來哈误，“玉大人哩至，你說我怎么就攤上這事∶圩裕” “怎么了菩貌？”我有些...
開封第一講書人閱讀 164,960評論 0贊 355
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長重荠。經(jīng)常有香客問我菜谣，道長，這世上最難降的妖魔是什么晚缩？我笑而不...
開封第一講書人閱讀 58,750評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮媳危，結(jié)果婚禮上荞彼，老公的妹妹穿的比我還像新娘。我一直安慰自己待笑，他們只是感情好鸣皂，可當(dāng)我...
茶點(diǎn)故事閱讀 67,764評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著暮蹂，像睡著了一般寞缝。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上仰泻，一...
開封第一講書人閱讀 51,604評論 1贊 305
城市分裂傳說
那天荆陆，我揣著相機(jī)與錄音，去河邊找鬼集侯。笑死被啼，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的棠枉。我是一名探鬼主播浓体，決...
沈念sama閱讀 40,347評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼辈讶！你這毒婦竟也來了命浴？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,253評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎生闲，沒想到半個月后媳溺，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,702評論 1贊 315
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡跪腹，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,893評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年褂删，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片冲茸。...
茶點(diǎn)故事閱讀 40,015評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡屯阀，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出轴术，到底是詐尸還是另有隱情难衰，我是刑警寧澤，帶...
沈念sama閱讀 35,734評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布逗栽，位于F島的核電站盖袭，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏彼宠。R本人自食惡果不足惜鳄虱，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,352評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望凭峡。院中可真熱鬧拙已，春花似錦、人聲如沸摧冀。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,934評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽索昂。三九已至建车，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間椒惨，已是汗流浹背缤至。一陣腳步聲響...
開封第一講書人閱讀 33,052評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留康谆，地道東北人凄杯。一個月前我還...
沈念sama閱讀 48,216評論 3贊 371
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子岭皂，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,969評論 2贊 355

17、pandas的merge合并函數(shù)

17度陆、pandas的merge合并函數(shù)

推薦閱讀更多精彩內(nèi)容