spark應(yīng)用開發(fā)-日常監(jiān)控

運(yùn)行監(jiān)控對(duì)系統(tǒng)的重要性不言而喻,尤其是分布式環(huán)境中鸽心,程序運(yùn)行是否正常秋茫,在哪些節(jié)點(diǎn)上運(yùn)行史简,每個(gè)節(jié)點(diǎn)處理的數(shù)據(jù)量是否均勻,每個(gè)任務(wù)的處理時(shí)間是否大致均衡肛著,在流處理程序中每個(gè)批次是否能及時(shí)處理圆兵,是否有批次延遲,這些信息都是必須要監(jiān)控的重要信息枢贿,也是程序優(yōu)化的基礎(chǔ)殉农。對(duì)于以上信息可以通過(guò)spark自帶的WEB UI來(lái)監(jiān)控,默認(rèn)已經(jīng)開啟萨咕。spark也提供了與第三方監(jiān)控系統(tǒng)的接口统抬,本文只介紹spark自帶的WEB UI中的監(jiān)控信息。

每個(gè)程序的啟動(dòng)會(huì)占用driver側(cè)一個(gè)端口危队,默認(rèn)為4040聪建,由參數(shù)spark.ui.port控制。

可以在driver側(cè)的配置文件中設(shè)置默認(rèn)端口或提交運(yùn)行時(shí)通過(guò)參數(shù)指定 --conf spark.ui.port=4141
當(dāng)然也可以在代碼中寫死val conf = new SparkConf().set("spark.ui.port","4141")
如果在同一臺(tái)機(jī)器上會(huì)提交大量作業(yè)時(shí)需要注意茫陆,如果默認(rèn)端口已被占用金麸,會(huì)在此端口基礎(chǔ)上+1再試,不行再+1一直持續(xù)到成功或超過(guò)spark.port.maxRetries指定的次數(shù)還沒有成功的話簿盅,任務(wù)啟動(dòng)失敗挥下,所以這種情況最好通過(guò)參數(shù)--conf spark.ui.port=xxxxx給每個(gè)作業(yè)都指定端口。

以下界面分別spark應(yīng)用開發(fā)-開發(fā)工具篇介紹的兩個(gè)示例程序的監(jiān)控頁(yè)面桨醋。
//spark


//spark streaming

相對(duì)于spark程序spark streaming程序的web ui中除了"Jobs"棚瘟、"Stages"、"Storage"喜最、"Environment"偎蘸、"Executors"外還多了一個(gè)“streaming”標(biāo)簽。
Jobs: job列表,顯示每個(gè)作業(yè)的時(shí)間信息以及共有多少stage以及task迷雪,可以鏈接到具體的stages頁(yè)面,這個(gè)頁(yè)面需要重點(diǎn)關(guān)注每個(gè)job的時(shí)間限书,以及是否有作業(yè)有大量的失敗的任務(wù)。

Stages :Stage列表章咧,顯示stage的輸入倦西、輸出以及Shuffle讀寫的數(shù)據(jù)量,并且可以鏈接到每一個(gè)task的執(zhí)行情況赁严,包括執(zhí)行次數(shù)扰柠,task狀態(tài),locality級(jí)別误澳、GC時(shí)間耻矮,輸入、輸出數(shù)據(jù)量等等忆谓,這里面需要重點(diǎn)關(guān)注task的執(zhí)行時(shí)間裆装,gc時(shí)間,以及各task花費(fèi)時(shí)間相差是否不大倡缠。
比如下圖中有任務(wù)第一次沒有執(zhí)行成功

locality_level按優(yōu)先級(jí)高低排:PROCESS_LOCAL哨免,NODE_LOCAL,NO_PREF昙沦,RACK_LOCAL琢唾,ANY。也就是最好在同個(gè)進(jìn)程里盾饮,次好是同個(gè)node(即機(jī)器)上采桃,再次是同機(jī)架,或任意都行

Storage: 存儲(chǔ)情況
Environment:環(huán)境信息丘损、各種各樣的參數(shù)信息普办。可以在這里看到實(shí)際spark.ui.port是多少
Executors :executor列表徘钥,在這里查看到各個(gè)executor輸出的日志衔蹲,如下圖就是一個(gè)實(shí)際程序的截圖,可以通過(guò)stdout/stderr查看日志呈础。

streaming: 顯示每個(gè)批次有多少數(shù)據(jù)舆驶,總共處理了多少批次,每個(gè)批次處理花費(fèi)的時(shí)間而钞,是否有批次延遲等信息沙廉,如下圖是一個(gè)正運(yùn)行的streaming程序的監(jiān)控頁(yè)面。

重點(diǎn)需要關(guān)注的是active batches臼节,如果active batches下面的批次大于1則證明有延遲批次
streaming statistics:中顯示的事件的數(shù)據(jù)接收泰涂、調(diào)度延遲、處理時(shí)間胜宇,合計(jì)延遲的統(tǒng)計(jì)信息迂卢。
completed batches :已完成批次(只顯示是最近)的信息,可以通過(guò)鏈接進(jìn)行具體的Job中途凫。如果發(fā)現(xiàn)某批次處理時(shí)間有異常垢夹,可以通過(guò)鏈接看到具體的Job信息,進(jìn)而查看到stage,最終追蹤到具體的task中维费,比如下圖就是“Stage”標(biāo)簽中果元。

spark on yarn中的監(jiān)控

spark on yarn在的環(huán)境中,要通過(guò)yarn的頁(yè)面才能正確進(jìn)入到監(jiān)控頁(yè)面犀盟。如下圖點(diǎn)tracking ui才能正確進(jìn)入頁(yè)面而晒。

其它

還可以用腳本通過(guò)http://localhost:4040/mertics/json獲取的json格式的監(jiān)控信息,格式類似下面


可以用python很容易的解析出來(lái)具體內(nèi)容阅畴,最近一批次消息數(shù)據(jù)倡怎,處理延遲、處理時(shí)間等的信息贱枣。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末监署,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子纽哥,更是在濱河造成了極大的恐慌钠乏,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,509評(píng)論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件春塌,死亡現(xiàn)場(chǎng)離奇詭異晓避,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)只壳,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門俏拱,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人吕世,你說(shuō)我怎么就攤上這事彰触。” “怎么了命辖?”我有些...
    開封第一講書人閱讀 163,875評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵况毅,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我尔艇,道長(zhǎng)尔许,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,441評(píng)論 1 293
  • 正文 為了忘掉前任终娃,我火速辦了婚禮味廊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己余佛,他們只是感情好柠新,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,488評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著辉巡,像睡著了一般恨憎。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上郊楣,一...
    開封第一講書人閱讀 51,365評(píng)論 1 302
  • 那天憔恳,我揣著相機(jī)與錄音,去河邊找鬼净蚤。 笑死钥组,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的今瀑。 我是一名探鬼主播程梦,決...
    沈念sama閱讀 40,190評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼放椰!你這毒婦竟也來(lái)了作烟?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,062評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤砾医,失蹤者是張志新(化名)和其女友劉穎拿撩,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體如蚜,經(jīng)...
    沈念sama閱讀 45,500評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡压恒,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,706評(píng)論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了错邦。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片探赫。...
    茶點(diǎn)故事閱讀 39,834評(píng)論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖撬呢,靈堂內(nèi)的尸體忽然破棺而出伦吠,到底是詐尸還是另有隱情,我是刑警寧澤魂拦,帶...
    沈念sama閱讀 35,559評(píng)論 5 345
  • 正文 年R本政府宣布毛仪,位于F島的核電站,受9級(jí)特大地震影響芯勘,放射性物質(zhì)發(fā)生泄漏箱靴。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,167評(píng)論 3 328
  • 文/蒙蒙 一荷愕、第九天 我趴在偏房一處隱蔽的房頂上張望衡怀。 院中可真熱鬧棍矛,春花似錦、人聲如沸抛杨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)怖现。三九已至慨绳,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間真竖,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工厌小, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留恢共,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,958評(píng)論 2 370
  • 正文 我出身青樓璧亚,卻偏偏與公主長(zhǎng)得像讨韭,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子癣蟋,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,779評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容