Spark Streaming實時流處理-1.初識實時流處理

目錄

  1. 業(yè)務現(xiàn)狀分析
  2. 實時流處理產(chǎn)生背景
  3. 實時流處理概述
  4. 離線計算與實時計算對比
  5. 實時流處理框架對比
  6. 實時流處理架構與技術選型
  7. 實時流處理在企業(yè)中的應用

1. 業(yè)務現(xiàn)狀分析

需求:統(tǒng)計主站每個(指定)課程訪問的客戶端兔仰、地域信息分布旷偿。

  • 地域:IP轉換
  • 客戶端:useragent獲取

實現(xiàn)步驟:

  • 拿到課程編號,IP信息鲸伴,UserAgent
  • 進行相應的統(tǒng)計分析操作:MapReduce/Spark

項目架構:基于Hadoop的實現(xiàn)方案

  • 日志收集:Flume
  • 離線分析:MapReduce/Spark
  • 統(tǒng)計結果圖形化展示

問題:

  • 小時級別統(tǒng)計沒問題
  • 10分鐘忌愚,也可能處理過來
  • 如果是5分鐘呢?1分鐘呢?

如何解決呢?使用實時流處理先鱼。

2. 實時流處理產(chǎn)生背景

  • 時效性高:業(yè)務對時效性要求比較高
  • 數(shù)據(jù)量大:業(yè)務數(shù)據(jù)量比較大,但是數(shù)據(jù)有效密度比較低

3. 實時流處理概述

  • 實時計算:響應時間比較短胁出。
  • 流式計算:數(shù)據(jù)不斷的進入型型,不停頓段审。
  • 實時流式計算:在不斷產(chǎn)生的數(shù)據(jù)流上全蝶,進行實時計算。

4. 離線計算與實時計算對比

  1. 數(shù)據(jù)來源
    • 離線:HDFS歷史數(shù)據(jù)寺枉,數(shù)據(jù)量比較大抑淫。
    • 實時:消息隊列(Kafka),實時新增/修改記錄實時過來的某一筆數(shù)據(jù)姥闪。
  2. 處理過程
    • 離線:Map + Reduce
    • 實時:Spark(DStream/SS)
  3. 處理速度
    • 離線:速度慢
    • 實時:快速拿到結果
  4. 進程角度
    • 離線:啟動 + 銷毀進程
    • 實時: 7 * 24小時進行統(tǒng)計始苇,線程不停止

5. 實時流處理框架對比

  • Apache Storm:Apache頂級項目,完全的實時流處理框架筐喳。
  • Apache Spark Streaming:基于Spark API進行擴展催式,并不是完全實時的,是按照時間間隔拆成小的批處理避归。嚴格并不是實時流處理框架荣月,而是小的批處理框架。
  • IBM Stream:用的比較少梳毙。
  • Yahoo! S4
  • LinkedIn Kafka:不止消息隊列哺窄,也包括了實時流處理。
  • Flink:既可以做流式也可以做批處理。

6. 實時流處理架構與技術選型

spark-streaming1.png
  • Flume實時收集WebServer產(chǎn)生日志
  • 添加Kafka消息隊列坷襟,進行流量消峰,防止Spark/Storm崩掉
  • 處理完數(shù)據(jù)生年,持久化到RDBMS/NoSQL
  • 最后進行可視化展示

7. 實時流處理在企業(yè)中的應用

  • 電信行業(yè):推薦流量包一類
  • 電商行業(yè):大屏啊婴程,推薦算法
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市蹲蒲,隨后出現(xiàn)的幾起案子侵贵,更是在濱河造成了極大的恐慌届搁,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件窍育,死亡現(xiàn)場離奇詭異卡睦,居然都是意外死亡,警方通過查閱死者的電腦和手機漱抓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進店門表锻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人乞娄,你說我怎么就攤上這事瞬逊。” “怎么了仪或?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵确镊,是天一觀的道長。 經(jīng)常有香客問我范删,道長蕾域,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任到旦,我火速辦了婚禮旨巷,結果婚禮上,老公的妹妹穿的比我還像新娘添忘。我一直安慰自己采呐,他們只是感情好,可當我...
    茶點故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布昔汉。 她就那樣靜靜地躺著懈万,像睡著了一般拴清。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上会通,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天口予,我揣著相機與錄音,去河邊找鬼涕侈。 笑死沪停,一個胖子當著我的面吹牛,可吹牛的內容都是我干的裳涛。 我是一名探鬼主播木张,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼端三!你這毒婦竟也來了舷礼?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤郊闯,失蹤者是張志新(化名)和其女友劉穎妻献,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體团赁,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡育拨,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了欢摄。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片熬丧。...
    茶點故事閱讀 39,785評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖怀挠,靈堂內的尸體忽然破棺而出析蝴,到底是詐尸還是另有隱情,我是刑警寧澤唆香,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布嫌变,位于F島的核電站,受9級特大地震影響躬它,放射性物質發(fā)生泄漏。R本人自食惡果不足惜东涡,卻給世界環(huán)境...
    茶點故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一冯吓、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧疮跑,春花似錦组贺、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春掀潮,著一層夾襖步出監(jiān)牢的瞬間菇夸,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工仪吧, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留庄新,地道東北人。 一個月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓薯鼠,卻偏偏與公主長得像择诈,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子出皇,可洞房花燭夜當晚...
    茶點故事閱讀 44,713評論 2 354

推薦閱讀更多精彩內容