85绞旅、Spark Streaming之輸入DStream和Receiver詳解

輸入DStream和Receiver詳解

輸入DStream代表了來自數(shù)據(jù)源的輸入數(shù)據(jù)流。在之前的wordcount例子中，lines就是一個(gè)輸入DStream（JavaReceiverInputDStream），代表了從netcat（nc）服務(wù)接收到的數(shù)據(jù)流营勤。除了文件數(shù)據(jù)流之外，所有的輸入DStream都會(huì)綁定一個(gè)Receiver對(duì)象壹罚，該對(duì)象是一個(gè)關(guān)鍵的組件葛作，用來從數(shù)據(jù)源接收數(shù)據(jù)，并將其存儲(chǔ)在Spark的內(nèi)存中渔嚷，以供后續(xù)處理进鸠。
Spark Streaming提供了兩種內(nèi)置的數(shù)據(jù)源支持

基礎(chǔ)數(shù)據(jù)源：StreamingContext API中直接提供了對(duì)這些數(shù)據(jù)源的支持，比如文件形病、socket、Akka Actor等霞幅。
高級(jí)數(shù)據(jù)源：諸如Kafka漠吻、Flume、Kinesis司恳、Twitter等數(shù)據(jù)源途乃，通過第三方工具類提供支持。這些數(shù)據(jù)源的使用扔傅，需要引用其依賴耍共。
自定義數(shù)據(jù)源：我們可以自己定義數(shù)據(jù)源，來決定如何接受和存儲(chǔ)數(shù)據(jù)猎塞。

要注意的是试读，如果你想要在實(shí)時(shí)計(jì)算應(yīng)用中并行接收多條數(shù)據(jù)流，可以創(chuàng)建多個(gè)輸入DStream荠耽。這樣就會(huì)創(chuàng)建多個(gè)Receiver钩骇，從而并行地接收多個(gè)數(shù)據(jù)流。但是要注意的是，一個(gè)Spark Streaming Application的Executor倘屹，是一個(gè)長時(shí)間運(yùn)行的任務(wù)银亲，因此，它會(huì)獨(dú)占分配給Spark Streaming Application的cpu core纽匙。從而只要Spark Streaming運(yùn)行起來以后务蝠，這個(gè)節(jié)點(diǎn)上的cpu core，就沒法給其他應(yīng)用使用了烛缔。
使用本地模式请梢，運(yùn)行程序時(shí)，絕對(duì)不能用local或者local[1]力穗，因?yàn)槟菢拥脑捯慊。粫?huì)給執(zhí)行輸入DStream的executor分配一個(gè)線程。而Spark Streaming底層的原理是当窗，至少要有兩條線程够坐，一條線程用來分配給Receiver接收數(shù)據(jù)，一條線程用來處理接收到的數(shù)據(jù)崖面。因此必須使用local[n]元咙，n>=2的模式。
如果不設(shè)置Master巫员，也就是直接將Spark Streaming應(yīng)用提交到集群上運(yùn)行庶香，那么首先，必須要求集群節(jié)點(diǎn)上简识，有>1個(gè)cpu core赶掖，其次，給Spark Streaming的每個(gè)executor分配的core七扰，必須>1奢赂，這樣，才能保證分配到executor上運(yùn)行的輸入DStream颈走，兩條線程并行膳灶，一條運(yùn)行Receiver，接收數(shù)據(jù)立由；一條處理數(shù)據(jù)轧钓。否則的話，只會(huì)接收數(shù)據(jù)锐膜，不會(huì)處理數(shù)據(jù)毕箍。

看下圖片，更能說明問題

Receiver和cpu core分配說明.png

所以說枣耀，集群的節(jié)點(diǎn)上霉晕，總共擁有的cpu core庭再，首先，必須是大于Spark Streaming Application的Receiver數(shù)量牺堰，因?yàn)橐粋€(gè)Receiver獨(dú)占一個(gè)CPU core
其次拄轻，在spark-submit腳本中，給Application分配的總的cpu core伟葫，肯定小于等于集群的cpu core的數(shù)量恨搓，大于Receiver的數(shù)量

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市筏养，隨后出現(xiàn)的幾起案子斧抱，更是在濱河造成了極大的恐慌，老刑警劉巖渐溶，帶你破解...
沈念sama閱讀 219,490評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件辉浦，死亡現(xiàn)場離奇詭異，居然都是意外死亡茎辐，警方通過查閱死者的電腦和手機(jī)宪郊，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,581評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來拖陆，“玉大人弛槐，你說我怎么就攤上這事∫绬” “怎么了乎串？”我有些...
開封第一講書人閱讀 165,830評(píng)論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長速警。經(jīng)常有香客問我叹誉，道長，這世上最難降的妖魔是什么坏瞄？我笑而不...
開封第一講書人閱讀 58,957評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任桂对，我火速辦了婚禮，結(jié)果婚禮上鸠匀，老公的妹妹穿的比我還像新娘。我一直安慰自己逾柿，他們只是感情好缀棍，可當(dāng)我...
茶點(diǎn)故事閱讀 67,974評(píng)論 6贊 393
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著机错，像睡著了一般爬范。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上弱匪，一...
開封第一講書人閱讀 51,754評(píng)論 1贊 307
城市分裂傳說
那天青瀑，我揣著相機(jī)與錄音，去河邊找鬼。笑死斥难，一個(gè)胖子當(dāng)著我的面吹牛枝嘶，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播哑诊，決...
沈念sama閱讀 40,464評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼群扶，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了镀裤？” 一聲冷哼從身側(cè)響起竞阐，我...
開封第一講書人閱讀 39,357評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎暑劝，沒想到半個(gè)月后骆莹，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,847評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡担猛，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,995評(píng)論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年幕垦，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片毁习。...
茶點(diǎn)故事閱讀 40,137評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡智嚷，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出纺且，到底是詐尸還是另有隱情盏道，我是刑警寧澤，帶...
沈念sama閱讀 35,819評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布载碌，位于F島的核電站猜嘱，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏嫁艇。R本人自食惡果不足惜朗伶，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,482評(píng)論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望步咪。院中可真熱鬧论皆，春花似錦、人聲如沸猾漫。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,023評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽悯周。三九已至粒督，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間禽翼，已是汗流浹背屠橄。一陣腳步聲響...
開封第一講書人閱讀 33,149評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工族跛，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人锐墙。一個(gè)月前我還...
沈念sama閱讀 48,409評(píng)論 3贊 373
代替公主和親
正文我出身青樓礁哄，卻偏偏與公主長得像，于是被迫代替她去往敵國和親贮匕。傳聞我的和親對(duì)象是個(gè)殘疾皇子姐仅，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,086評(píng)論 2贊 355

85吮铭、Spark Streaming之輸入DStream和Receiver詳解

85绞旅、Spark Streaming之輸入DStream和Receiver詳解

輸入DStream和Receiver詳解

推薦閱讀更多精彩內(nèi)容