Spark Streaming實時流處理-1.初識實時流處理

1. 業(yè)務現(xiàn)狀分析

需求：統(tǒng)計主站每個（指定）課程訪問的客戶端兔仰、地域信息分布旷偿。

地域：IP轉換
客戶端：useragent獲取

實現(xiàn)步驟：

拿到課程編號，IP信息鲸伴，UserAgent
進行相應的統(tǒng)計分析操作：MapReduce/Spark

項目架構：基于Hadoop的實現(xiàn)方案

日志收集：Flume
離線分析：MapReduce/Spark
統(tǒng)計結果圖形化展示

問題：

小時級別統(tǒng)計沒問題
10分鐘忌愚，也可能處理過來
如果是5分鐘呢？1分鐘呢？

如何解決呢？使用實時流處理先鱼。

2. 實時流處理產(chǎn)生背景

時效性高：業(yè)務對時效性要求比較高
數(shù)據(jù)量大：業(yè)務數(shù)據(jù)量比較大，但是數(shù)據(jù)有效密度比較低

3. 實時流處理概述

實時計算：響應時間比較短胁出。
流式計算：數(shù)據(jù)不斷的進入型型，不停頓段审。
實時流式計算：在不斷產(chǎn)生的數(shù)據(jù)流上全蝶，進行實時計算。

4. 離線計算與實時計算對比

數(shù)據(jù)來源
- 離線：HDFS歷史數(shù)據(jù)寺枉，數(shù)據(jù)量比較大抑淫。
- 實時：消息隊列（Kafka），實時新增/修改記錄實時過來的某一筆數(shù)據(jù)姥闪。
處理過程
- 離線：Map + Reduce
- 實時：Spark(DStream/SS)
處理速度
- 離線：速度慢
- 實時：快速拿到結果
進程角度
- 離線：啟動 + 銷毀進程
- 實時： 7 * 24小時進行統(tǒng)計始苇，線程不停止

5. 實時流處理框架對比

Apache Storm：Apache頂級項目，完全的實時流處理框架筐喳。
Apache Spark Streaming：基于Spark API進行擴展催式，并不是完全實時的，是按照時間間隔拆成小的批處理避归。嚴格并不是實時流處理框架荣月，而是小的批處理框架。
IBM Stream：用的比較少梳毙。
Yahoo! S4
LinkedIn Kafka：不止消息隊列哺窄，也包括了實時流處理。
Flink：既可以做流式也可以做批處理。

6. 實時流處理架構與技術選型

spark-streaming1.png

Flume實時收集WebServer產(chǎn)生日志
添加Kafka消息隊列坷襟，進行流量消峰，防止Spark/Storm崩掉
處理完數(shù)據(jù)生年，持久化到RDBMS/NoSQL
最后進行可視化展示

7. 實時流處理在企業(yè)中的應用

電信行業(yè)：推薦流量包一類
電商行業(yè)：大屏啊婴程，推薦算法

最后編輯于：2018.10.29 22:41:04

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市蹲蒲，隨后出現(xiàn)的幾起案子侵贵，更是在濱河造成了極大的恐慌届搁，老刑警劉巖，帶你破解...
沈念sama閱讀 217,277評論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件窍育，死亡現(xiàn)場離奇詭異卡睦，居然都是意外死亡，警方通過查閱死者的電腦和手機漱抓，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,689評論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門表锻，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人乞娄，你說我怎么就攤上這事瞬逊。” “怎么了仪或？”我有些...
開封第一講書人閱讀 163,624評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵确镊，是天一觀的道長。經(jīng)常有香客問我范删，道長蕾域，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,356評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任到旦，我火速辦了婚禮旨巷，結果婚禮上，老公的妹妹穿的比我還像新娘添忘。我一直安慰自己采呐，他們只是感情好，可當我...
茶點故事閱讀 67,402評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布昔汉。她就那樣靜靜地躺著懈万，像睡著了一般拴清。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上会通，一...
開封第一講書人閱讀 51,292評論 1贊 301
城市分裂傳說
那天口予，我揣著相機與錄音，去河邊找鬼涕侈。笑死沪停，一個胖子當著我的面吹牛，可吹牛的內容都是我干的裳涛。我是一名探鬼主播木张，決...
沈念sama閱讀 40,135評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼端三！你這毒婦竟也來了舷礼？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 38,992評論 0贊 275
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤郊闯，失蹤者是張志新（化名）和其女友劉穎妻献，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體团赁，經(jīng)...
沈念sama閱讀 45,429評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡育拨，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,636評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了欢摄。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片熬丧。...
茶點故事閱讀 39,785評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖怀挠，靈堂內的尸體忽然破棺而出析蝴，到底是詐尸還是另有隱情，我是刑警寧澤唆香，帶...
沈念sama閱讀 35,492評論 5贊 345
?日本核電站爆炸內幕
正文年R本政府宣布嫌变，位于F島的核電站，受9級特大地震影響躬它，放射性物質發(fā)生泄漏。R本人自食惡果不足惜东涡，卻給世界環(huán)境...
茶點故事閱讀 41,092評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一冯吓、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧疮跑，春花似錦组贺、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,723評論 0贊 22
一樁弒父案失尖，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春掀潮，著一層夾襖步出監(jiān)牢的瞬間菇夸，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,858評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工仪吧，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留庄新，地道東北人。一個月前我還...
沈念sama閱讀 47,891評論 2贊 370
代替公主和親
正文我出身青樓薯鼠，卻偏偏與公主長得像择诈，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子出皇，可洞房花燭夜當晚...
茶點故事閱讀 44,713評論 2贊 354

Spark Streaming實時流處理-1.初識實時流處理

Spark Streaming實時流處理-1.初識實時流處理

目錄

1. 業(yè)務現(xiàn)狀分析

2. 實時流處理產(chǎn)生背景

3. 實時流處理概述

4. 離線計算與實時計算對比

5. 實時流處理框架對比

6. 實時流處理架構與技術選型

7. 實時流處理在企業(yè)中的應用

推薦閱讀更多精彩內容