SparkStreaming如何優(yōu)雅的停止服務(wù)

我們都知道SparkStreaming程序是一個(gè)長服務(wù)，一旦運(yùn)轉(zhuǎn)起來不會(huì)輕易停掉衫樊，那么如果我們想要停掉正在運(yùn)行的程序應(yīng)該怎么做呢飒赃？
如果運(yùn)行的是spark on yarn模式直接使用

yarn application -kill taskId

暴力停掉sparkstreaming是有可能出現(xiàn)問題的，比如你的數(shù)據(jù)源是kafka科侈，已經(jīng)加載了一批數(shù)據(jù)到sparkstreaming中正在處理载佳，如果中途停掉，這個(gè)批次的數(shù)據(jù)很有可能沒有處理完，就被強(qiáng)制stop了藕漱，下次啟動(dòng)時(shí)候會(huì)重復(fù)消費(fèi)或者部分?jǐn)?shù)據(jù)丟失肋联。

如何優(yōu)雅的關(guān)閉spark streaming呢？方式主要有三種：

第一種：全人工介入

Spark 1.3及其前的版本

通過 Runtime.getRuntime().addShutdownHook 注冊關(guān)閉鉤子侮繁， JVM將在關(guān)閉之前執(zhí)行關(guān)閉鉤子中的 run函數(shù)（不管是正常退出還是異常退出都會(huì)調(diào)用）彬祖，所以我們可以在 driver 代碼中加入以下代碼：
JAVA代碼：

Runtime.getRuntime().addShutdownHook(new Thread() {
 override def run() {
   log("Shutting down streaming app...")
   ssc.stop(true, true)
   log("Shutdown of streaming app complete.")
 }
})

或
Scala方式：

    sys.ShutdownHookThread
    {
      ssc.stop(true, true)
    }

這樣就能保證即使 application 被強(qiáng)行 kill 掉圆恤，在 driver 結(jié)束前羽历，ssc.stop(true, true)也會(huì)被調(diào)用，從而保證已接收的數(shù)據(jù)都會(huì)被處理跳夭。

Spark 1.4及其后的版本

上一小節(jié)介紹的方法僅適用于 1.3及以前的版本，在 1.4及其后的版本中不僅不能保證生效模狭，甚至?xí)鹚梨i等線程問題践磅。在 1.4及其后的版本中，只需要在SparkConf里面設(shè)置下面的參數(shù)即可：

sparkConf.set("spark.streaming.stopGracefullyOnShutdown","true")

然后按照下面的步驟依次操作：

通過Hadoop 8088頁面找到運(yùn)行的程序
打開spark ui的監(jiān)控頁面
打開executor的監(jiān)控頁面
登錄liunx找到驅(qū)動(dòng)節(jié)點(diǎn)所在的機(jī)器ip以及運(yùn)行的端口號
然后執(zhí)行一個(gè)封裝好的命令

sudo ss -tanlp |  grep 5555 |awk '{print $6}'|awk  -F, '{print $2}' | sudo  xargs kill -15

注意上面的操作執(zhí)行后，sparkstreaming程序浑侥，并不會(huì)立即停止寓落，而是會(huì)把當(dāng)前的批處理里面的數(shù)據(jù)處理完畢后才會(huì)停掉史飞，此間sparkstreaming不會(huì)再消費(fèi)kafka的數(shù)據(jù)祸憋，這樣以來就能保證結(jié)果不丟和重復(fù)蚯窥。

從上面的步驟可以看出，這樣停掉一個(gè)spark streaming程序是比較復(fù)雜的。那么有沒有更加優(yōu)雅的方式來停止它呢允乐？答案是有的

第二種：使用HDFS系統(tǒng)做消息通知

在驅(qū)動(dòng)程序中，加一段代碼鳞陨，這段代碼的作用每隔一段時(shí)間可以是10秒也可以是3秒歼狼，掃描HDFS上某一個(gè)文件趟咆，如果發(fā)現(xiàn)這個(gè)文件存在，就調(diào)用StreamContext對象stop方法计雌，自己優(yōu)雅的終止自己妈橄，其實(shí)這里HDFS可以換成redis反番，zk罢缸，hbase爵川，db都可以，這里唯一的問題就是依賴了外部的一個(gè)存儲系統(tǒng)來達(dá)到消息通知的目的圃泡，如果使用了這種方式后洞焙。停止流程序就比較簡單了褒链，登錄上有hdfs客戶端的機(jī)器惦费，然后touch一個(gè)空文件到指定目錄，然后等到間隔的掃描時(shí)間到之后鳍贾，發(fā)現(xiàn)有文件存在构拳，就知道需要關(guān)閉程序了。

第三種：內(nèi)部暴露一個(gè)socket或者h(yuǎn)ttp端口用來接收請求，等待觸發(fā)關(guān)閉流程序

這種方式，需要在driver啟動(dòng)一個(gè)socket線程县好，或者h(yuǎn)ttp服務(wù)拣播，這里推薦使用http服務(wù)，因?yàn)閟ocket有點(diǎn)偏底層處理起來稍微復(fù)雜點(diǎn)，如果使用http服務(wù)，我們可以直接用內(nèi)嵌的jetty，對外暴露一個(gè)http接口辟拷，spark ui頁面用的也是內(nèi)嵌的jetty提供服務(wù)隅俘，所以我不需要在pom里面引入額外的依賴杀狡，在關(guān)閉的時(shí)候，找到驅(qū)動(dòng)所在ip，就可以直接通過curl或者瀏覽器就直接關(guān)閉流程序。
找到驅(qū)動(dòng)程序所在的ip，可以在程序啟動(dòng)的log中看到阐肤，也可以在spark master ui的頁面上找到。這種方式不依賴任何外部的存儲系統(tǒng)削罩，僅僅部署的時(shí)候需要一個(gè)額外的端口號用來暴露http服務(wù)愿阐。

至此辛孵，關(guān)于優(yōu)雅的停止spark streaming的主流方式已經(jīng)介紹完畢焚廊，推薦使用第二種或者第三種搞疗，如果想要最大程度減少對外部系統(tǒng)的依賴，推薦使用第三種方式。

關(guān)于具體第二種和第三種的樣例代碼，下篇文章會(huì)整理一下放在github中給大家參考。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末霸旗，一起剝皮案震驚了整個(gè)濱河市蔬啡，隨后出現(xiàn)的幾起案子空猜，更是在濱河造成了極大的恐慌谆沃，老刑警劉巖据沈，帶你破解...
沈念sama閱讀 216,372評論 6贊 498
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件肿嘲，死亡現(xiàn)場離奇詭異拇涤，居然都是意外死亡掉盅，警方通過查閱死者的電腦和手機(jī)永票，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,368評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人睬涧，你說我怎么就攤上這事祷嘶〉べ鳎” “怎么了焙矛？”我有些...
開封第一講書人閱讀 162,415評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經(jīng)常有香客問我归榕，道長盅蝗，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,157評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任贼穆，我火速辦了婚禮，結(jié)果婚禮上愕秫，老公的妹妹穿的比我還像新娘戴甩。我一直安慰自己缴川，他們只是感情好铭污，可當(dāng)我...
茶點(diǎn)故事閱讀 67,171評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著唉锌，像睡著了一般。火紅的嫁衣襯著肌膚如雪泛啸。梳的紋絲不亂的頭發(fā)上绿语，一...
開封第一講書人閱讀 51,125評論 1贊 297
城市分裂傳說
那天，我揣著相機(jī)與錄音候址，去河邊找鬼吕粹。笑死，一個(gè)胖子當(dāng)著我的面吹牛岗仑，可吹牛的內(nèi)容都是我干的匹耕。我是一名探鬼主播，決...
沈念sama閱讀 40,028評論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼荠雕，長吁一口氣：“原來是場噩夢啊……” “哼稳其！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起炸卑，我...
開封第一講書人閱讀 38,887評論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤既鞠，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后矾兜，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體损趋，經(jīng)...
沈念sama閱讀 45,310評論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,533評論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年椅寺，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了浑槽。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,690評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡返帕，死狀恐怖桐玻，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情荆萤，我是刑警寧澤镊靴，帶...
沈念sama閱讀 35,411評論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站链韭，受9級特大地震影響偏竟，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜敞峭，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,004評論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一踊谋、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧旋讹，春花似錦殖蚕、人聲如沸轿衔。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評論 0贊 22
一樁弒父案睦疫，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽害驹。三九已至，卻和暖如春蛤育，著一層夾襖步出監(jiān)牢的瞬間宛官，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,812評論 1贊 268
情欲美人皮
我被黑心中介騙來泰國打工缨伊，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留摘刑，地道東北人进宝。一個(gè)月前我還...
沈念sama閱讀 47,693評論 2贊 368
代替公主和親
正文我出身青樓刻坊，卻偏偏與公主長得像，于是被迫代替她去往敵國和親党晋。傳聞我的和親對象是個(gè)殘疾皇子谭胚，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,577評論 2贊 353