[flow]Kafka+Spark Streaming+Redis實時計算整合


Spark 實戰(zhàn), 第 2 部分:使用 Kafka 和 Spark Streaming 構(gòu)建實時數(shù)據(jù)處理系統(tǒng)
https://www.ibm.com/developerworks/cn/opensource/os-cn-spark-practice2/
關(guān)于 Spark Steaming
Spark Streaming 模塊是對于 Spark Core 的一個擴展霜大,目的是為了以高吞吐量,并且容錯的方式處理持續(xù)性的數(shù)據(jù)流腾务。目前 Spark Streaming 支持的外部數(shù)據(jù)源有 Flume、 Kafka陷遮、Twitter疗韵、ZeroMQ瓣赂、TCP Socket 等。
Discretized Stream 也叫 DStream) 是 Spark Streaming 對于持續(xù)數(shù)據(jù)流的一種基本抽象鲤竹,在內(nèi)部實現(xiàn)上浪读,DStream 會被表示成一系列連續(xù)的 RDD(彈性分布式數(shù)據(jù)集),每一個 RDD 都代表一定時間間隔內(nèi)到達的數(shù)據(jù)辛藻。所以在對 DStream 進行操作時瑟啃,會被 Spark Stream 引擎轉(zhuǎn)化成對底層 RDD 的操作。對 Dstream 的操作類型有:

Transformations: 類似于對 RDD 的操作揩尸,Spark Streaming 提供了一系列的轉(zhuǎn)換操作去支持對 DStream 的修改蛹屿。如 map,union,filter,transform 等

Window Operations: 窗口操作支持通過設(shè)置窗口長度和滑動間隔的方式操作數(shù)據(jù)。常用的操作有 reduceByWindow,reduceByKeyAndWindow,window 等

Output Operations: 輸出操作允許將 DStream 數(shù)據(jù)推送到其他外部系統(tǒng)或存儲平臺, 如 HDFS, Database 等岩榆,類似于 RDD 的 Action 操作错负,Output 操作也會實際上觸發(fā)對 DStream 的轉(zhuǎn)換操作坟瓢。常用的操作有 print,saveAsTextFiles,saveAsHadoopFiles, foreachRDD 等。


簡單之美 | Kafka+Spark Streaming+Redis實時計算整合實踐
http://shiyanjun.cn/archives/1097.html

基于Spark通用計算平臺犹撒,可以很好地擴展各種計算類型的應(yīng)用折联,尤其是Spark提供了內(nèi)建的計算庫支持,像Spark Streaming识颊、Spark SQL诚镰、MLlib、GraphX祥款,這些內(nèi)建庫都提供了高級抽象清笨,可以用非常簡潔的代碼實現(xiàn)復(fù)雜的計算邏輯、這也得益于Scala編程語言的簡潔性刃跛。這里抠艾,我們基于1.3.0版本的Spark搭建了計算平臺,實現(xiàn)基于Spark Streaming的實時計算桨昙。
我們的應(yīng)用場景是分析用戶使用手機App的行為检号,描述如下所示:

手機客戶端會收集用戶的行為事件(我們以點擊事件為例),將數(shù)據(jù)發(fā)送到數(shù)據(jù)服務(wù)器蛙酪,我們假設(shè)這里直接進入到Kafka消息隊列
后端的實時服務(wù)會從Kafka消費數(shù)據(jù)齐苛,將數(shù)據(jù)讀出來并進行實時分析,這里選擇Spark Streaming桂塞,因為Spark Streaming提供了與Kafka整合的內(nèi)置支持
經(jīng)過Spark Streaming實時計算程序分析凹蜂,將結(jié)果寫入Redis,可以實時獲取用戶的行為數(shù)據(jù)藐俺,并可以導(dǎo)出進行離線綜合統(tǒng)計分析


開源大數(shù)據(jù)技術(shù)漫談
http://sanwen8.cn/p/150ZTVb.html
實時數(shù)據(jù)輸入解決方案讓輸入數(shù)據(jù)以流的方式實時地進入大數(shù)據(jù)系統(tǒng)炊甲,而不必先存儲到HDFS文件系統(tǒng)中泥彤,從而避免了由于磁盤IO造成的性能損失欲芹。Apache Kafka, RabbitMQ吟吝,Apache Flume等是當(dāng)前比較流行的開源方案菱父,其中Apache Kafka越來越引人注目,這主要歸功于其恐怖的性能指標剑逃。 Kafka目前用于LinkedIn浙宜,它每天處理超過100億消息,持續(xù)負載平均每秒172,000消息蛹磺。目前粟瞬,無論從內(nèi)部和外部的使用數(shù)據(jù)的應(yīng)用程序大量使用多訂閱者支持。每個消息發(fā)布出來后萤捆,基本上會有5.5個消息消費者使用裙品,這導(dǎo)致的結(jié)果是每一天將有550億的消息發(fā)送給實時消費者俗批。


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市市怎,隨后出現(xiàn)的幾起案子岁忘,更是在濱河造成了極大的恐慌,老刑警劉巖区匠,帶你破解...
    沈念sama閱讀 206,311評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件干像,死亡現(xiàn)場離奇詭異,居然都是意外死亡驰弄,警方通過查閱死者的電腦和手機麻汰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來揩懒,“玉大人什乙,你說我怎么就攤上這事∫亚颍” “怎么了臣镣?”我有些...
    開封第一講書人閱讀 152,671評論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長智亮。 經(jīng)常有香客問我忆某,道長,這世上最難降的妖魔是什么阔蛉? 我笑而不...
    開封第一講書人閱讀 55,252評論 1 279
  • 正文 為了忘掉前任弃舒,我火速辦了婚禮,結(jié)果婚禮上状原,老公的妹妹穿的比我還像新娘聋呢。我一直安慰自己,他們只是感情好颠区,可當(dāng)我...
    茶點故事閱讀 64,253評論 5 371
  • 文/花漫 我一把揭開白布削锰。 她就那樣靜靜地躺著,像睡著了一般毕莱。 火紅的嫁衣襯著肌膚如雪器贩。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,031評論 1 285
  • 那天朋截,我揣著相機與錄音蛹稍,去河邊找鬼。 笑死部服,一個胖子當(dāng)著我的面吹牛唆姐,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播廓八,決...
    沈念sama閱讀 38,340評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼奉芦,長吁一口氣:“原來是場噩夢啊……” “哼胆描!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起仗阅,我...
    開封第一講書人閱讀 36,973評論 0 259
  • 序言:老撾萬榮一對情侶失蹤昌讲,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后减噪,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體短绸,經(jīng)...
    沈念sama閱讀 43,466評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,937評論 2 323
  • 正文 我和宋清朗相戀三年筹裕,在試婚紗的時候發(fā)現(xiàn)自己被綠了醋闭。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,039評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡朝卒,死狀恐怖证逻,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情抗斤,我是刑警寧澤囚企,帶...
    沈念sama閱讀 33,701評論 4 323
  • 正文 年R本政府宣布,位于F島的核電站瑞眼,受9級特大地震影響龙宏,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜伤疙,卻給世界環(huán)境...
    茶點故事閱讀 39,254評論 3 307
  • 文/蒙蒙 一银酗、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧徒像,春花似錦黍特、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,259評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至谬墙,卻和暖如春今布,著一層夾襖步出監(jiān)牢的瞬間经备,已是汗流浹背拭抬。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留侵蒙,地道東北人造虎。 一個月前我還...
    沈念sama閱讀 45,497評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像纷闺,于是被迫代替她去往敵國和親算凿。 傳聞我的和親對象是個殘疾皇子份蝴,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,786評論 2 345

推薦閱讀更多精彩內(nèi)容