一個(gè)基于flinkSql 的實(shí)時(shí)計(jì)算平臺

一乏盐、可行性分析

Flink是一款分布式的計(jì)算引擎佳窑,它可以用來做批處理,即處理靜態(tài)的數(shù)據(jù)集丑勤、歷史的數(shù)據(jù)集华嘹;也可以用來做流處理吧趣,即實(shí)時(shí)地處理一些實(shí)時(shí)數(shù)據(jù)流法竞,實(shí)時(shí)地產(chǎn)生數(shù)據(jù)的結(jié)果。既然是一個(gè)實(shí)時(shí)計(jì)算平臺强挫,這里主要用到他的流處理能力岔霸。他被稱之為繼storm、sparkStreaming 之后的第三代流處理引擎俯渤。

對于應(yīng)用Flink的開發(fā)者來說關(guān)系的是數(shù)據(jù)源是什么呆细,做什么處理,數(shù)據(jù)落到哪里去八匠。這是一個(gè)通用的數(shù)據(jù)處理邏輯絮爷,在flink中抽象成 source、operator梨树、sink三部分坑夯。flinkSQL 中會把source定義成一張table,也就是tableSource。operator就是常寫的sql邏輯抡四,比如count柜蜈、group by 之類的仗谆。sink 在flinkSQl中稱為tableSink。在flinkSQL 編程過程中需要事先注冊TableSource 和 TableSink淑履,也就是源表是什么隶垮,結(jié)果表是什么,中間的sql就是從源表select 進(jìn)行sql聚合計(jì)算之類的秘噪,insert into 到結(jié)果表狸吞。

對于tableSource來說最終對接的數(shù)據(jù)源可以是關(guān)系型數(shù)據(jù)庫oracle、mysql..;可以是消息隊(duì)列kafka,可以是NOSQL Hbase缆娃、redis 之類的捷绒、等等。需要思考的無非就是在獲取這些數(shù)據(jù)源的時(shí)候怎么轉(zhuǎn)換成flink內(nèi)部的tabe贯要。

對于operator來說可以直接寫sql語句 + UDF函數(shù)就可以暖侨,當(dāng)然在流處理中還有一些特殊的計(jì)算比如window.。如果需要的話崇渗,那可能還需要創(chuàng)造sql之外的語法結(jié)構(gòu)字逗。最好的是將這些非sql原生的在平臺內(nèi)部消化掉,盡量讓用戶覺得易用宅广。

對于TableSink 來說同tableSource.因?yàn)槲覀兛赡軙褦?shù)據(jù)寫入各種組件葫掉。一個(gè)sql語句的在Flink里面是Row格式。我們需要做的就是解析SQL產(chǎn)生的Row結(jié)果寫入不同的組件跟狱。

二俭厚、平臺構(gòu)思

上面所述基本只是說明了這個(gè)平臺的可行性。該怎么實(shí)現(xiàn)呢驶臊?先對平臺進(jìn)行一下構(gòu)思挪挤。

一、平臺的通用性

既然是一個(gè)基于flinkSql實(shí)時(shí)計(jì)算平臺关翎。希望用戶更多的是寫sql來解決用戶的需求扛门。用戶可以選擇自己的數(shù)據(jù)源,然后編寫sql,然后選擇sql結(jié)果的落地方纵寝,便可以形成job進(jìn)行運(yùn)行论寨。這部分需要有一個(gè)前臺系統(tǒng)去支持。這里不是重點(diǎn)爽茴。但是最終前臺sql的編排會形成一個(gè)job的描述這個(gè)描述可以是一個(gè)josn串葬凳。大概分為4部分。

1室奏、source schema描述

主要是描述source是什么數(shù)據(jù)源火焰,他有哪些字段,字段的類型是什么

2窍奋、業(yè)務(wù)邏輯sql

這個(gè)就是簡單了就是一個(gè)sql語言荐健。和臨時(shí)表之類的

3酱畅、sink schema描述

主要是描述sink是什么數(shù)據(jù)源,他有哪些字段江场,字段的類型是什么

4纺酸、任務(wù)描述

主要描述這個(gè)任務(wù)在flink上運(yùn)行需要多少資源,等等一些flink內(nèi)部的參數(shù)

二址否、平臺怎么使用

上面所說的其實(shí)我們實(shí)現(xiàn)的只是一個(gè)在flink中適配各種數(shù)據(jù)存儲組件的程序包餐蔬。他只是一個(gè)模板。他本身是不知道使用人員是要干啥佑附。他必須拿到j(luò)ob的描述之后才能替開發(fā)sql的人員干活樊诺。job的描述相當(dāng)于是平臺的配置信息。下面是我的一個(gè)使用構(gòu)想圖音同。有更好方案的可以留言聯(lián)系我


三词爬、后續(xù)進(jìn)展透露<敬請關(guān)注>

一、針對數(shù)據(jù)源是JSON格式的并且是有嵌套對象权均,嵌套數(shù)組的怎么解析成Table

http://www.reibang.com/p/848a399d977e

二顿膨、剖析fink中kafkaTbaleSource的實(shí)現(xiàn)? ? ?

http://www.reibang.com/p/53b0f149d33e

三、剖析fink中kafkaTbaleSink的實(shí)現(xiàn)

原理同?剖析fink中kafkaTbaleSource的實(shí)現(xiàn)

http://www.reibang.com/p/53b0f149d33e

四叽赊、改造kafkaTbaleSource

五恋沃、改造kafkaTbaleSink

六、實(shí)現(xiàn)HbaseTableSource

七必指、實(shí)現(xiàn)HbaseTbaleSink

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末囊咏,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子塔橡,更是在濱河造成了極大的恐慌梅割,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,681評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件谱邪,死亡現(xiàn)場離奇詭異炮捧,居然都是意外死亡庶诡,警方通過查閱死者的電腦和手機(jī)惦银,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,205評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來末誓,“玉大人扯俱,你說我怎么就攤上這事±瑁” “怎么了迅栅?”我有些...
    開封第一講書人閱讀 169,421評論 0 362
  • 文/不壞的土叔 我叫張陵,是天一觀的道長晴玖。 經(jīng)常有香客問我读存,道長为流,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,114評論 1 300
  • 正文 為了忘掉前任让簿,我火速辦了婚禮敬察,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘尔当。我一直安慰自己莲祸,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,116評論 6 398
  • 文/花漫 我一把揭開白布椭迎。 她就那樣靜靜地躺著锐帜,像睡著了一般。 火紅的嫁衣襯著肌膚如雪畜号。 梳的紋絲不亂的頭發(fā)上缴阎,一...
    開封第一講書人閱讀 52,713評論 1 312
  • 那天,我揣著相機(jī)與錄音简软,去河邊找鬼药蜻。 笑死,一個(gè)胖子當(dāng)著我的面吹牛替饿,可吹牛的內(nèi)容都是我干的语泽。 我是一名探鬼主播,決...
    沈念sama閱讀 41,170評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼视卢,長吁一口氣:“原來是場噩夢啊……” “哼踱卵!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起据过,我...
    開封第一講書人閱讀 40,116評論 0 277
  • 序言:老撾萬榮一對情侶失蹤惋砂,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后绳锅,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體西饵,經(jīng)...
    沈念sama閱讀 46,651評論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,714評論 3 342
  • 正文 我和宋清朗相戀三年鳞芙,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了眷柔。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,865評論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡原朝,死狀恐怖驯嘱,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情喳坠,我是刑警寧澤鞠评,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站壕鹉,受9級特大地震影響剃幌,放射性物質(zhì)發(fā)生泄漏聋涨。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,211評論 3 336
  • 文/蒙蒙 一负乡、第九天 我趴在偏房一處隱蔽的房頂上張望牛郑。 院中可真熱鬧,春花似錦敬鬓、人聲如沸淹朋。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,699評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽础芍。三九已至,卻和暖如春数尿,著一層夾襖步出監(jiān)牢的瞬間仑性,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,814評論 1 274
  • 我被黑心中介騙來泰國打工右蹦, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留诊杆,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 49,299評論 3 379
  • 正文 我出身青樓何陆,卻偏偏與公主長得像晨汹,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子贷盲,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,870評論 2 361