5. Hadoop之旅——Hive使用篇(二)

最佳的復(fù)制一個(gè)partitioned表的步驟:

  1. 創(chuàng)建新的目標(biāo)弯屈,跟舊表一樣的schema. 如:
    create table new_xx like xx;
  2. 使用 hadoop fs -cp 把舊表所有的分區(qū)文件,拷貝到目標(biāo)表的文件夾谱姓。
  3. 運(yùn)行 MSCK REPAIR TABLE new_xx.
    這樣就可以完成一個(gè)partition表的復(fù)制

應(yīng)對(duì)Load Data時(shí),分隔符在field中出現(xiàn)

對(duì)于TextFormat的hive表脆烟,當(dāng)文本格式的數(shù)據(jù)绍妨,每列的分隔符是 逗號(hào)‘,',而其中一列中的數(shù)據(jù)也包含逗號(hào)的時(shí)候漠魏,直接load會(huì)造成列的分割混亂倔矾。 這個(gè)時(shí)候, 可以使用escaped來解決這個(gè)問題:

  1. create table 中指定 ESCAPED BY蛉幸, 指定轉(zhuǎn)義符破讨,如下使用''作為轉(zhuǎn)義符
create teable 
……
ROW FORMAT DELIMITED FIELDS TERMINATED BY "," ESCAPED BY '\\';  
……

對(duì)于已經(jīng)存在的表,可以增加escape.delim

ALTER TABLE XXXX   
set serde 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES ('escape.delim'='\\');
  1. 文本文件中奕纫,對(duì)列中含有','的提陶, 替換為 ',',使用轉(zhuǎn)義匹层。

hive local 模式

在hive shell中隙笆。 當(dāng)用limit 1查看數(shù)據(jù)概況。 或者操作的數(shù)據(jù)量小升筏,不需要在多個(gè)結(jié)點(diǎn)之間shuffle的時(shí)候撑柔。可以使用hive 的local模式您访,不用申請(qǐng)集群資源铅忿,反而能更快得到結(jié)果。
set hive.exec.mode.local.auto = true; 會(huì)自動(dòng)根據(jù)查詢灵汪,判斷是否采用local模式

hive beeline 使用心得

  1. beeline 提交hive任務(wù)檀训,產(chǎn)生OOM異常, java.lang.OutOfMemoryError: GC overhead limit exceeded:
    beeline 任務(wù)會(huì)啟動(dòng)一個(gè)java進(jìn)程享言,設(shè)置了-Xmx峻凫,當(dāng)返回行數(shù)過多,內(nèi)存使用太高览露,會(huì)頻繁的GC荧琼,從而出現(xiàn)這個(gè)錯(cuò)誤。
    *改進(jìn)辦法: 增加beeline啟動(dòng)參數(shù)--incremental=true, 增量模式返回結(jié)果命锄。
    例子:
/home/work/tars/hive-0.13.1-cdh5.2.0-all/bin/beeline --incremental=true -u "jdbc:hive2://XXX" --outputformat=tsv -e "set mapreduce.job.queuename=default" -e "${SQL}" > "/data/output_information"
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末堰乔,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子累舷,更是在濱河造成了極大的恐慌浩考,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件被盈,死亡現(xiàn)場離奇詭異析孽,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)只怎,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門袜瞬,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人身堡,你說我怎么就攤上這事邓尤。” “怎么了贴谎?”我有些...
    開封第一講書人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵汞扎,是天一觀的道長。 經(jīng)常有香客問我擅这,道長澈魄,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任仲翎,我火速辦了婚禮痹扇,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘溯香。我一直安慰自己鲫构,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開白布玫坛。 她就那樣靜靜地躺著结笨,像睡著了一般。 火紅的嫁衣襯著肌膚如雪湿镀。 梳的紋絲不亂的頭發(fā)上炕吸,一...
    開封第一講書人閱讀 49,111評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音肠骆,去河邊找鬼。 笑死塞耕,一個(gè)胖子當(dāng)著我的面吹牛蚀腿,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼莉钙,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼廓脆!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起磁玉,我...
    開封第一講書人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤停忿,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后蚊伞,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體席赂,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年时迫,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了颅停。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡掠拳,死狀恐怖癞揉,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情溺欧,我是刑警寧澤喊熟,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布,位于F島的核電站姐刁,受9級(jí)特大地震影響芥牌,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜龙填,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一胳泉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧岩遗,春花似錦扇商、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至梆靖,卻和暖如春控汉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背返吻。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來泰國打工姑子, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人测僵。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓街佑,卻偏偏與公主長得像谢翎,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子沐旨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容