Flink實(shí)時(shí)流計(jì)算入門系列(一)

?阿里巴巴雙11大屏在峰值期間可以承擔(dān)每秒超過4.72億次的訪問饲常,這是多高的訪問量……為什么學(xué)習(xí)Flink?

image

這幾年大數(shù)據(jù)的飛速發(fā)展歇拆,出現(xiàn)了很多熱門大數(shù)據(jù)計(jì)算框架择浊,著名的Hadoop伤靠、Storm捣域、Spark,他們都專注于各自的應(yīng)用場景宴合。

Spark掀開了內(nèi)存計(jì)算的先河焕梅,也以內(nèi)存為賭注,贏得了內(nèi)存計(jì)算的飛速發(fā)展卦洽。Spark 的火熱或多或少的掩蓋了其他分布式計(jì)算的系統(tǒng)身影贞言。就像 Flink,也就在這個(gè)時(shí)候默默的發(fā)展著阀蒂。

Flink認(rèn)為有界數(shù)據(jù)集是無界數(shù)據(jù)流的一種特例该窗,所以說有界數(shù)據(jù)集也是一種數(shù)據(jù)流,事件流也是一種數(shù)據(jù)流蚤霞。

在國外一些社區(qū)酗失,有很多人將大數(shù)據(jù)的計(jì)算引擎分成了4 代,當(dāng)然也有很多人不會認(rèn)同争便。

  • 第1代——Hadoop MapReduce

  • 第2代——DAG框架(****Tez****) + MapReduce

  • 第3代——Spark

  • 第4代——Flink

隨著業(yè)務(wù)場景的復(fù)雜程度增加、實(shí)時(shí)性能要求的提高断医,SparkStreaming微批次準(zhǔn)實(shí)時(shí)計(jì)算在一定程度上滿足不了業(yè)務(wù)需求滞乙,F(xiàn)link在實(shí)時(shí)流計(jì)算的性能尤為顯著奏纪,隨著阿里的廣泛使用,F(xiàn)link已成為當(dāng)前流計(jì)算領(lǐng)域的首選架斩启。

快速入門 Flink 應(yīng)用程序結(jié)構(gòu)主要包含三部分,Source/Transformation/Sink

  • Source: 數(shù)據(jù)源序调,F(xiàn)link 在流處理和批處理上的 source 大概有 4 類:

  • 基于本地集合的 source

  • 基于文件的 source

  • 基于網(wǎng)絡(luò)套接字的 source

  • 自定義的 source。自定義的 source 常見的有 Apache kafka兔簇、Amazon Kinesis Streams发绢、RabbitMQ、Twitter Streaming API垄琐、Apache NiFi 等边酒,當(dāng)然你也可以定義自己的 source。

  • Transformation:數(shù)據(jù)轉(zhuǎn)換的各種操作狸窘,有 Map / FlatMap / Filter / KeyBy / Reduce / Fold / Aggregations / Window / WindowAll / Union / Window join / Split / Select / Project 等墩朦,操作很多,可以將數(shù)據(jù)轉(zhuǎn)換計(jì)算成你想要的數(shù)據(jù)翻擒。

  • Sink:接收器氓涣,F(xiàn)link 將轉(zhuǎn)換計(jì)算后的數(shù)據(jù)發(fā)送的地點(diǎn) ,你可能需要存儲下來陋气,F(xiàn)link 常見的 Sink 大概有如下幾類:

  • 寫入文件劳吠、

  • 打印輸出、

  • 寫入 socket 巩趁、

  • 自定義的 sink 痒玩。自定義的 sink 常見的有 Apache kafka、RabbitMQ晶渠、MySQL凰荚、ElasticSearch、Apache Cassandra褒脯、Hadoop FileSystem 等便瑟,同理你也可以定義自己的 Sink。

Flink批處理入門示例

Flink 做為一款流式計(jì)算框架番川,它可用來做批處理到涂,即處理靜態(tài)的數(shù)據(jù)集、歷史的數(shù)據(jù)集颁督;也可以用來做流處理践啄,即實(shí)時(shí)的處理些實(shí)時(shí)數(shù)據(jù)流,實(shí)時(shí)的產(chǎn)生數(shù)據(jù)流結(jié)果沉御,只要數(shù)據(jù)源源不斷的過來屿讽,F(xiàn)link 就能夠一直計(jì)算下去。

通過flink來讀取本地文件,實(shí)現(xiàn)單詞統(tǒng)計(jì)功能伐谈,把統(tǒng)計(jì)結(jié)果寫入本地文件中烂完,體現(xiàn)flink的批處理。效果如下诵棵,左邊為源文件抠蚣,右邊為統(tǒng)計(jì)結(jié)果

image

編程步驟:
一、建立maven項(xiàng)目履澳,添加相關(guān)依賴

 <properties>

實(shí)現(xiàn)單詞統(tǒng)計(jì)主要代碼

object BathchFromFiles {

運(yùn)行效果圖:

image

往期精彩

覺得還不錯(cuò)的話歡迎關(guān)注公號:一點(diǎn)IT技術(shù)

"轉(zhuǎn)發(fā)和分享是對作者最大的支持及鼓勵(lì)"

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末储耐,一起剝皮案震驚了整個(gè)濱河市羊初,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌什湘,老刑警劉巖长赞,帶你破解...
    沈念sama閱讀 218,386評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異闽撤,居然都是意外死亡得哆,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評論 3 394
  • 文/潘曉璐 我一進(jìn)店門哟旗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來贩据,“玉大人,你說我怎么就攤上這事闸餐”チ粒” “怎么了?”我有些...
    開封第一講書人閱讀 164,704評論 0 353
  • 文/不壞的土叔 我叫張陵舍沙,是天一觀的道長近上。 經(jīng)常有香客問我,道長拂铡,這世上最難降的妖魔是什么壹无? 我笑而不...
    開封第一講書人閱讀 58,702評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮感帅,結(jié)果婚禮上斗锭,老公的妹妹穿的比我還像新娘。我一直安慰自己失球,他們只是感情好岖是,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,716評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般豺撑。 火紅的嫁衣襯著肌膚如雪作箍。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,573評論 1 305
  • 那天前硫,我揣著相機(jī)與錄音,去河邊找鬼荧止。 笑死屹电,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的跃巡。 我是一名探鬼主播危号,決...
    沈念sama閱讀 40,314評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼素邪!你這毒婦竟也來了外莲?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,230評論 0 276
  • 序言:老撾萬榮一對情侶失蹤兔朦,失蹤者是張志新(化名)和其女友劉穎偷线,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體沽甥,經(jīng)...
    沈念sama閱讀 45,680評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡声邦,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,873評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了摆舟。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片亥曹。...
    茶點(diǎn)故事閱讀 39,991評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖恨诱,靈堂內(nèi)的尸體忽然破棺而出媳瞪,到底是詐尸還是另有隱情,我是刑警寧澤照宝,帶...
    沈念sama閱讀 35,706評論 5 346
  • 正文 年R本政府宣布蛇受,位于F島的核電站,受9級特大地震影響硫豆,放射性物質(zhì)發(fā)生泄漏龙巨。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,329評論 3 330
  • 文/蒙蒙 一熊响、第九天 我趴在偏房一處隱蔽的房頂上張望旨别。 院中可真熱鬧,春花似錦汗茄、人聲如沸秸弛。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽递览。三九已至叼屠,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間绞铃,已是汗流浹背镜雨。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留儿捧,地道東北人荚坞。 一個(gè)月前我還...
    沈念sama閱讀 48,158評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像菲盾,于是被迫代替她去往敵國和親颓影。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,941評論 2 355