spark應(yīng)用開發(fā)-日常監(jiān)控

運(yùn)行監(jiān)控對(duì)系統(tǒng)的重要性不言而喻，尤其是分布式環(huán)境中鸽心，程序運(yùn)行是否正常秋茫，在哪些節(jié)點(diǎn)上運(yùn)行史简，每個(gè)節(jié)點(diǎn)處理的數(shù)據(jù)量是否均勻，每個(gè)任務(wù)的處理時(shí)間是否大致均衡肛著，在流處理程序中每個(gè)批次是否能及時(shí)處理圆兵，是否有批次延遲，這些信息都是必須要監(jiān)控的重要信息枢贿，也是程序優(yōu)化的基礎(chǔ)殉农。對(duì)于以上信息可以通過(guò)spark自帶的WEB UI來(lái)監(jiān)控，默認(rèn)已經(jīng)開啟萨咕。spark也提供了與第三方監(jiān)控系統(tǒng)的接口统抬，本文只介紹spark自帶的WEB UI中的監(jiān)控信息。

每個(gè)程序的啟動(dòng)會(huì)占用driver側(cè)一個(gè)端口危队，默認(rèn)為4040聪建，由參數(shù)spark.ui.port控制。

可以在driver側(cè)的配置文件中設(shè)置默認(rèn)端口或提交運(yùn)行時(shí)通過(guò)參數(shù)指定 --conf spark.ui.port=4141
當(dāng)然也可以在代碼中寫死val conf = new SparkConf().set("spark.ui.port","4141")
如果在同一臺(tái)機(jī)器上會(huì)提交大量作業(yè)時(shí)需要注意茫陆，如果默認(rèn)端口已被占用金麸，會(huì)在此端口基礎(chǔ)上+1再試，不行再+1一直持續(xù)到成功或超過(guò)spark.port.maxRetries指定的次數(shù)還沒有成功的話簿盅，任務(wù)啟動(dòng)失敗挥下，所以這種情況最好通過(guò)參數(shù)--conf spark.ui.port=xxxxx給每個(gè)作業(yè)都指定端口。

以下界面分別spark應(yīng)用開發(fā)-開發(fā)工具篇介紹的兩個(gè)示例程序的監(jiān)控頁(yè)面桨醋。
//spark

//spark streaming

相對(duì)于spark程序spark streaming程序的web ui中除了"Jobs"棚瘟、"Stages"、"Storage"喜最、"Environment"偎蘸、"Executors"外還多了一個(gè)“streaming”標(biāo)簽。
Jobs: job列表，顯示每個(gè)作業(yè)的時(shí)間信息以及共有多少stage以及task迷雪，可以鏈接到具體的stages頁(yè)面,這個(gè)頁(yè)面需要重點(diǎn)關(guān)注每個(gè)job的時(shí)間限书，以及是否有作業(yè)有大量的失敗的任務(wù)。

Stages :Stage列表章咧，顯示stage的輸入倦西、輸出以及Shuffle讀寫的數(shù)據(jù)量，并且可以鏈接到每一個(gè)task的執(zhí)行情況赁严，包括執(zhí)行次數(shù)扰柠，task狀態(tài)，locality級(jí)別误澳、GC時(shí)間耻矮，輸入、輸出數(shù)據(jù)量等等忆谓，這里面需要重點(diǎn)關(guān)注task的執(zhí)行時(shí)間裆装，gc時(shí)間，以及各task花費(fèi)時(shí)間相差是否不大倡缠。
比如下圖中有任務(wù)第一次沒有執(zhí)行成功

locality_level按優(yōu)先級(jí)高低排：PROCESS_LOCAL哨免，NODE_LOCAL，NO_PREF昙沦，RACK_LOCAL琢唾，ANY。也就是最好在同個(gè)進(jìn)程里盾饮，次好是同個(gè)node(即機(jī)器)上采桃，再次是同機(jī)架，或任意都行

Storage: 存儲(chǔ)情況
Environment：環(huán)境信息丘损、各種各樣的參數(shù)信息普办。可以在這里看到實(shí)際spark.ui.port是多少
Executors :executor列表徘钥，在這里查看到各個(gè)executor輸出的日志衔蹲，如下圖就是一個(gè)實(shí)際程序的截圖，可以通過(guò)stdout/stderr查看日志呈础。

streaming：顯示每個(gè)批次有多少數(shù)據(jù)舆驶，總共處理了多少批次，每個(gè)批次處理花費(fèi)的時(shí)間而钞，是否有批次延遲等信息沙廉，如下圖是一個(gè)正運(yùn)行的streaming程序的監(jiān)控頁(yè)面。

重點(diǎn)需要關(guān)注的是active batches臼节，如果active batches下面的批次大于1則證明有延遲批次
streaming statistics:中顯示的事件的數(shù)據(jù)接收泰涂、調(diào)度延遲、處理時(shí)間胜宇，合計(jì)延遲的統(tǒng)計(jì)信息迂卢。
completed batches :已完成批次(只顯示是最近)的信息，可以通過(guò)鏈接進(jìn)行具體的Job中途凫。如果發(fā)現(xiàn)某批次處理時(shí)間有異常垢夹，可以通過(guò)鏈接看到具體的Job信息，進(jìn)而查看到stage,最終追蹤到具體的task中维费，比如下圖就是“Stage”標(biāo)簽中果元。

spark on yarn中的監(jiān)控

spark on yarn在的環(huán)境中，要通過(guò)yarn的頁(yè)面才能正確進(jìn)入到監(jiān)控頁(yè)面犀盟。如下圖點(diǎn)tracking ui才能正確進(jìn)入頁(yè)面而晒。

其它

還可以用腳本通過(guò)http://localhost:4040/mertics/json獲取的json格式的監(jiān)控信息，格式類似下面

可以用python很容易的解析出來(lái)具體內(nèi)容阅畴，最近一批次消息數(shù)據(jù)倡怎，處理延遲、處理時(shí)間等的信息贱枣。

最后編輯于：2017.12.06 08:14:25

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末监署，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子纽哥，更是在濱河造成了極大的恐慌钠乏，老刑警劉巖，帶你破解...
沈念sama閱讀 217,509評(píng)論 6贊 504
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件春塌，死亡現(xiàn)場(chǎng)離奇詭異晓避，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)只壳，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,806評(píng)論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門俏拱，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人吕世，你說(shuō)我怎么就攤上這事彰触。” “怎么了命辖？”我有些...
開封第一講書人閱讀 163,875評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵况毅，是天一觀的道長(zhǎng)。經(jīng)常有香客問我尔艇，道長(zhǎng)尔许，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,441評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任终娃，我火速辦了婚禮味廊，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己余佛，他們只是感情好柠新，可當(dāng)我...
茶點(diǎn)故事閱讀 67,488評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開白布。她就那樣靜靜地躺著辉巡，像睡著了一般恨憎。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上郊楣，一...
開封第一講書人閱讀 51,365評(píng)論 1贊 302
城市分裂傳說(shuō)
那天憔恳，我揣著相機(jī)與錄音，去河邊找鬼净蚤。笑死钥组，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的今瀑。我是一名探鬼主播程梦，決...
沈念sama閱讀 40,190評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼放椰！你這毒婦竟也來(lái)了作烟？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,062評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤砾医，失蹤者是張志新（化名）和其女友劉穎拿撩，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體如蚜，經(jīng)...
沈念sama閱讀 45,500評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡压恒，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,706評(píng)論 3贊 335
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了错邦。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片探赫。...
茶點(diǎn)故事閱讀 39,834評(píng)論 1贊 347
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖撬呢，靈堂內(nèi)的尸體忽然破棺而出伦吠，到底是詐尸還是另有隱情，我是刑警寧澤魂拦，帶...
沈念sama閱讀 35,559評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布毛仪，位于F島的核電站，受9級(jí)特大地震影響芯勘，放射性物質(zhì)發(fā)生泄漏箱靴。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,167評(píng)論 3贊 328
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一荷愕、第九天我趴在偏房一處隱蔽的房頂上張望衡怀。院中可真熱鬧棍矛，春花似錦、人聲如沸抛杨。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,779評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)怖现。三九已至慨绳，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間真竖，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,912評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工厌小，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留恢共，地道東北人。一個(gè)月前我還...
沈念sama閱讀 47,958評(píng)論 2贊 370
代替公主和親
正文我出身青樓璧亚，卻偏偏與公主長(zhǎng)得像讨韭，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子癣蟋，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,779評(píng)論 2贊 354

spark應(yīng)用開發(fā)-日常監(jiān)控

spark on yarn中的監(jiān)控

其它

推薦閱讀更多精彩內(nèi)容