生產(chǎn)beeline事故分析

場景分析

生產(chǎn)環(huán)境用beeline連接hive總是偶爾卡死
hive健康檢查也總是偶爾告警
hive健康檢查失敗的同時砚嘴，beeline連不上hive
場景截圖如下：
beeline連接超時

企業(yè)微信截圖_15313905439815.png

hive健康監(jiān)控失敗

hive健康監(jiān)控.png

事故分析

確定兩個事故是由于同一個問題引起的
排除metastore server的問題壹置；雖然告警角色是metastore server沽讹，原因如下:
1. 我們集群hive架構(gòu)圖如下：
  
  xhive_remotemetastore.jpg.pagespeed.ic.GNiWf952ue.jpg
2. 根據(jù)以上架構(gòu)圖，我們嘗試用hive cli和impala在hive健康告警的時候居然能順利連上而且服務(wù)使用無障礙（基于相同用戶，相同權(quán)限晃酒，各個節(jié)點(diǎn)都操作了一次）, 排除了metaStore服務(wù)問題
我們開始著手查看HiveServer2服務(wù)；當(dāng)時懷疑是hiveServer2的問題窄绒，因?yàn)閔ive健康檢查無非就是是通過hue權(quán)限去創(chuàng)建表贝次，創(chuàng)建分區(qū)，刪除表彰导，看下這些操作成不成功蛔翅；而且beeline連接的也是hiveServer2服務(wù)
查看hiveServer2日志敲茄，發(fā)現(xiàn)日志報(bào)大量以下錯誤

hiveServer2錯誤日志.png

看得一臉懵逼，大概意思就是hue通過thrift服務(wù)連接hiveServer2去刪除表的時候失敗山析。（hive健康檢查報(bào)的錯）

發(fā)現(xiàn)錯誤有關(guān)鍵字sentry
查看sentry日志堰燎，因?yàn)閔iveServer2日志有關(guān)鍵字sentry，雖然sentry一直沒報(bào)錯笋轨。也沒告警
查看sentry日志秆剪，發(fā)現(xiàn)有大量請求堆積

sentry-thrift.png

大概意思是，sentry的請求隊(duì)列滿了爵政，不再接受新的請求仅讽，注意pool size，active threads茂卦，rejected這幾個關(guān)鍵字
當(dāng)時推測何什，是不是因?yàn)閟entry處理請求的線程池( thrift的threadPool )滿了，所以當(dāng)hive對sentry發(fā)起請求的時候等龙，sentry服務(wù)拒絕了处渣，然后hive重試了幾次不行就放棄了，然后報(bào)錯
找到sentry所在服務(wù)器和端口號蛛砰，于是看了下連8038端口的host和port

#獲取端口號8038的socket統(tǒng)計(jì)信息罐栈，信息做了聚合和排序
 ss | grep 8038 |awk '{print $5}' | awk 'BEGIN{FS=":"} {print $1}' | sort  -n  |uniq -c | sort -r

8038端口socket情況.png

發(fā)現(xiàn)162-165這幾臺機(jī)器發(fā)送的請求特別多，于是上其中一臺機(jī)器查看

#參考同事命令泥畅，根據(jù)端口查看進(jìn)程
netstat -alntp |grep 8038

查看pid.png

上面的圖發(fā)現(xiàn)有問題的服務(wù)不斷在請求sentry:8038荠诬，根據(jù)pid查看服務(wù)

根據(jù)pid查看服務(wù).png
發(fā)現(xiàn)是kafka進(jìn)程不斷連接，于是停掉了kafka broker位仁，發(fā)現(xiàn)請求確實(shí)停下來了

重看sentry連接.png
hive beeline連不上和健康監(jiān)控告警的問題解決了
遺留問題柑贞，這幾個問題機(jī)器的kafka broker為啥不斷請求sentry，而其他的機(jī)器kafka broker確沒有這樣的問題聂抢，配置都是統(tǒng)一的

最后編輯于：2018.09.29 10:51:39

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末钧嘶，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子琳疏，更是在濱河造成了極大的恐慌有决，老刑警劉巖，帶你破解...
沈念sama閱讀 217,406評論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件空盼，死亡現(xiàn)場離奇詭異书幕，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)揽趾，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,732評論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門台汇，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事励七≈窍” “怎么了奔缠？”我有些...
開封第一講書人閱讀 163,711評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵掠抬，是天一觀的道長。經(jīng)常有香客問我校哎，道長两波，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,380評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任闷哆，我火速辦了婚禮腰奋，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘抱怔。我一直安慰自己劣坊，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,432評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布屈留。她就那樣靜靜地躺著局冰，像睡著了一般。火紅的嫁衣襯著肌膚如雪灌危。梳的紋絲不亂的頭發(fā)上康二，一...
開封第一講書人閱讀 51,301評論 1贊 301
城市分裂傳說
那天，我揣著相機(jī)與錄音勇蝙，去河邊找鬼沫勿。笑死，一個胖子當(dāng)著我的面吹牛味混，可吹牛的內(nèi)容都是我干的产雹。我是一名探鬼主播，決...
沈念sama閱讀 40,145評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼翁锡，長吁一口氣：“原來是場噩夢啊……” “哼蔓挖！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起盗誊，我...
開封第一講書人閱讀 39,008評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤时甚，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后哈踱，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體荒适，經(jīng)...
沈念sama閱讀 45,443評論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,649評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年开镣，在試婚紗的時候發(fā)現(xiàn)自己被綠了刀诬。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,795評論 1贊 347
活死人
序言：一個原本活蹦亂跳的男人離奇死亡邪财，死狀恐怖陕壹，靈堂內(nèi)的尸體忽然破棺而出质欲，到底是詐尸還是另有隱情，我是刑警寧澤糠馆，帶...
沈念sama閱讀 35,501評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布嘶伟，位于F島的核電站，受9級特大地震影響又碌，放射性物質(zhì)發(fā)生泄漏九昧。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,119評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一毕匀、第九天我趴在偏房一處隱蔽的房頂上張望铸鹰。院中可真熱鬧，春花似錦皂岔、人聲如沸蹋笼。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,731評論 0贊 22
一樁弒父案躁垛，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽剖毯。三九已至，卻和暖如春缤苫，著一層夾襖步出監(jiān)牢的瞬間速兔，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,865評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工活玲，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留涣狗，地道東北人。一個月前我還...
沈念sama閱讀 47,899評論 2贊 370
代替公主和親
正文我出身青樓舒憾，卻偏偏與公主長得像镀钓，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子镀迂，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,724評論 2贊 354

生產(chǎn)beeline事故分析

場景分析

事故分析

推薦閱讀更多精彩內(nèi)容