17度陆、pandas的merge合并函數(shù)

在使用Excel時艾凯,我用的最多函數(shù)就是vlookup;在使用SQL查詢的時候懂傀,我用的最多應(yīng)該是join趾诗;這兩個都有相同的功能,將多表匹配蹬蚁、合并恃泪,然后達(dá)到對比、查漏等等效果犀斋。在pandas里面也有類似的功能函數(shù)就是pd.merge()(pd是指 導(dǎo)入的pandas庫)贝乎。merge的用法跟SQL中join很像。

df1


df2

使用merge進(jìn)行合并:

使用merge進(jìn)行合并

基本的結(jié)構(gòu)為:pd.merge(df1叽粹,df2览效,合并方式,df1合并用的鍵虫几,df2合并用的鍵)锤灿。

后面兩個參數(shù)在合并的時候兩個表格使用的鍵的列名是一樣的時候可以改成on='title'

on='title'

結(jié)果和第一種方式是一樣的。

使用合并的時候pandas會默認(rèn)只選取一個相同的鍵列名持钉,然后其它的數(shù)據(jù)進(jìn)行合并衡招。

注意到兩張表格中有一個location_road是共同具有的一個列,因此合并之后兩個表格的location_road列分別加上了_x和_y的后綴以便區(qū)分每强,這兩個后綴也可以修改的(使用suffixes函數(shù)進(jìn)行修改):

使用suffixes函數(shù)修改后綴

merge函數(shù)還可以只取其中的某幾列數(shù)據(jù)進(jìn)行合并:

選擇某幾列進(jìn)行合并

選擇某幾列的時候需要注意的是如果使用on參數(shù)始腾,那么此參數(shù)指定的值兩個表格都要有州刽;還有一個非常重要的就是選擇多列的時候使用的是兩個中括號

使用merge合并方式有left, inner, right浪箭,outer穗椅,通過how參數(shù)來指定。

how = 'inner'表示的是只合并兩個表格都具有的行奶栖;

how = 'left'表示的是合并之后顯示的是第一個表格里的所有行匹表;

how = 'left'
第一個表與合并之后的表對比

how = 'right'表示的是合并之后顯示的是第二個表格里所有的行;

how = 'right'
第二個表與合并之后的表對比

細(xì)心的人肯定會發(fā)現(xiàn)了宣鄙,為什么使用how = 'right'合并之后的行數(shù)不是等于第二個表的行數(shù)呢袍镀?這是因為在第一個表的title列中有一個重復(fù)值被計算進(jìn)去了,所有多了一行(關(guān)于重復(fù)值的去除方法可以參考duplicated那篇的內(nèi)容)冻晤。

how = 'outer'表示的是兩個表格里所有的行都進(jìn)行合并苇羡。

how = 'outer'

在使用left,right鼻弧,outer的時候會產(chǎn)生空值设江,只要在語句的后面加.fillna(o)就可以填充空值了。

填充空值之后的表格

這也是pandas很方便的一個特點(diǎn):多個函數(shù)可以連在一起使用攘轩,只要用點(diǎn)連接起來就可以了叉存。

如果合并的時候要用索引作為鍵的話就不能用on,left_on和right_on了度帮,而是要使用left_index=True, right_index=True(也就是以索引為標(biāo)準(zhǔn)來進(jìn)行表聯(lián)結(jié)歼捏,而不是兩個表共同擁有的列)。

保留連接的列

因為是以索引作為聯(lián)結(jié)的笨篷,所以title不是對應(yīng)的甫菠,這個暫時還不清楚有什么比較好的應(yīng)用場景。

還有這個方法合并的時候是安裝鍵的順序進(jìn)行排列的冕屯,如果兩個表都很大的話合并時就會很慢寂诱,如果不需要排序就需要添加參數(shù)sort=False。

merge還有一個參數(shù)安聘,indicator=True痰洒,這個參數(shù)會添加一列用來注明每一行是來自于哪個表的:

使用indicator=True

以上所說的都是橫向合并,那么如果要進(jìn)行縱向合并要怎么操作呢浴韭?

merge()里并沒有axis=0這個參數(shù)丘喻,如果需要縱向匹配合并的話可以先將表格轉(zhuǎn)置(.T)之后再進(jìn)行合并。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末念颈,一起剝皮案震驚了整個濱河市泉粉,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖嗡靡,帶你破解...
    沈念sama閱讀 218,607評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件跺撼,死亡現(xiàn)場離奇詭異,居然都是意外死亡讨彼,警方通過查閱死者的電腦和手機(jī)歉井,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,239評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來哈误,“玉大人哩至,你說我怎么就攤上這事∶圩裕” “怎么了菩貌?”我有些...
    開封第一講書人閱讀 164,960評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長重荠。 經(jīng)常有香客問我菜谣,道長,這世上最難降的妖魔是什么晚缩? 我笑而不...
    開封第一講書人閱讀 58,750評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮媳危,結(jié)果婚禮上荞彼,老公的妹妹穿的比我還像新娘。我一直安慰自己待笑,他們只是感情好鸣皂,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,764評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著暮蹂,像睡著了一般寞缝。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上仰泻,一...
    開封第一講書人閱讀 51,604評論 1 305
  • 那天荆陆,我揣著相機(jī)與錄音,去河邊找鬼集侯。 笑死被啼,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的棠枉。 我是一名探鬼主播浓体,決...
    沈念sama閱讀 40,347評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼辈讶!你這毒婦竟也來了命浴?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,253評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎生闲,沒想到半個月后媳溺,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,702評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡跪腹,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,893評論 3 336
  • 正文 我和宋清朗相戀三年褂删,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片冲茸。...
    茶點(diǎn)故事閱讀 40,015評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡屯阀,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出轴术,到底是詐尸還是另有隱情难衰,我是刑警寧澤,帶...
    沈念sama閱讀 35,734評論 5 346
  • 正文 年R本政府宣布逗栽,位于F島的核電站盖袭,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏彼宠。R本人自食惡果不足惜鳄虱,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,352評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望凭峡。 院中可真熱鬧拙已,春花似錦、人聲如沸摧冀。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,934評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽索昂。三九已至建车,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間椒惨,已是汗流浹背缤至。 一陣腳步聲響...
    開封第一講書人閱讀 33,052評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留康谆,地道東北人凄杯。 一個月前我還...
    沈念sama閱讀 48,216評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子岭皂,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,969評論 2 355

推薦閱讀更多精彩內(nèi)容