Flink-Streaming-EventTime-Pre-defined Timestamp Extractors / Watermark Emitters

Flink提供了接口缕陕,允許編程者自定義 timesatmp extractor 與 watermark emitter瀑梗。更確切的說枢冤,可以根據(jù)情況征冷,實(shí)現(xiàn) AssignerWithPeriodicWatermarks 或 AssignerWithPunctuatedWatermarks接口歹颓。簡單來說坯屿,AssignerWithPeriodicWatermarks 會(huì)周期性的發(fā)射watermark,AssignerWithPunctuatedWatermarks 會(huì)根據(jù)數(shù)據(jù)的某些屬性來決定是否發(fā)射watermark巍扛。
為了更大程度的簡化這個(gè)編程過程领跛,flink自帶了一些默認(rèn)實(shí)現(xiàn)的timestamp assigner。這一部分會(huì)介紹它們撤奸。除了它們開箱即用的特性隔节,它們的實(shí)現(xiàn)也是一個(gè)實(shí)現(xiàn)自定義類的很好的參考。

Assigners with ascending timestamps

Periodic Watermarks最簡單的場景便是source中數(shù)據(jù)的timestamp是升序流入的寂呛。這種情況下怎诫,當(dāng)前流入數(shù)據(jù)的timestamp就可以當(dāng)做是watermark,因?yàn)椴粫?huì)有亂序的情況發(fā)生贷痪,也就是不會(huì)有小于當(dāng)前數(shù)據(jù)時(shí)間戳的數(shù)據(jù)在當(dāng)前數(shù)據(jù)之后流入幻妓。
注意,僅僅需要在每個(gè)并發(fā)的source task中保持上述特性就可以劫拢。例如:通過設(shè)置后肉津,每個(gè)Kafka partiton都在一個(gè)獨(dú)立的source task中讀取數(shù)據(jù),這時(shí)舱沧,只要求每個(gè)partition的數(shù)據(jù)的時(shí)間戳是升序的就可以妹沙。Flink的watermark的merge機(jī)制會(huì)在并發(fā)流的shuffled,unionconnected,merged時(shí)生成正確的watermark熟吏。

DataStream<MyEvent> stream = ...

DataStream<MyEvent> withTimestampsAndWatermarks =
    stream.assignTimestampsAndWatermarks(new AscendingTimestampExtractor<MyEvent>() {

        @Override
        public long extractAscendingTimestamp(MyEvent element) {
            return element.getCreationTime();
        }
});

Assingers allowing a fixed amount of lateness

另一個(gè)使用 Periodic Watermarks 的場景是watermark始終落后當(dāng)前流中最大時(shí)間戳一個(gè)固定的時(shí)間距糖。也適用于事前就知道流中數(shù)據(jù)的最大遲到時(shí)間的情況玄窝,如:在測試時(shí),使用自定義source讀取在一定時(shí)間范圍內(nèi)亂序的數(shù)據(jù)悍引。(注:最大遲到時(shí)間不是指數(shù)據(jù)的時(shí)間戳與系統(tǒng)時(shí)間的差值恩脂,而是遲到數(shù)據(jù)與該數(shù)據(jù)之前流入的數(shù)據(jù)的最大時(shí)間戳的差值)
對于這種情況,flink提供了 BoundedOutOfOrdernessTimestampExtractor 趣斤,它的入?yún)?maxOutOfOrderness俩块,也就是,對于給定的window來說浓领,它需要在event time坐標(biāo)系下等待多久的遲到數(shù)據(jù)之后再觸發(fā)計(jì)算(超過等待時(shí)間的數(shù)據(jù)會(huì)被忽略)玉凯。數(shù)據(jù)是否遲到取決于 lateness= t - t_w 的值,其中t代表event time坐標(biāo)系下數(shù)據(jù)的時(shí)間戳联贩,t_w代表該數(shù)據(jù)之前的最大watermark壮啊。如果 lateness > 0 ,那么該數(shù)據(jù)會(huì)被認(rèn)為是遲到了撑蒜,默認(rèn)情況下歹啼,當(dāng)進(jìn)行window計(jì)算時(shí),該數(shù)據(jù)會(huì)被忽略座菠,不參與計(jì)算狸眼。(注:根據(jù)這個(gè)公式,我覺得是 lateness < 0 的情況下浴滴,才是遲到數(shù)據(jù))

DataStream<MyEvent> stream = ...

DataStream<MyEvent> withTimestampsAndWatermarks =
    stream.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtractor<MyEvent>(Time.seconds(10)) {

        @Override
        public long extractTimestamp(MyEvent element) {
            return element.getCreationTime();
        }
});
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末拓萌,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子升略,更是在濱河造成了極大的恐慌微王,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,366評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件品嚣,死亡現(xiàn)場離奇詭異炕倘,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)翰撑,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門罩旋,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人眶诈,你說我怎么就攤上這事涨醋。” “怎么了逝撬?”我有些...
    開封第一講書人閱讀 165,689評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵浴骂,是天一觀的道長。 經(jīng)常有香客問我宪潮,道長溯警,這世上最難降的妖魔是什么趣苏? 我笑而不...
    開封第一講書人閱讀 58,925評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮愧膀,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘谣光。我一直安慰自己檩淋,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,942評(píng)論 6 392
  • 文/花漫 我一把揭開白布萄金。 她就那樣靜靜地躺著蟀悦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪氧敢。 梳的紋絲不亂的頭發(fā)上日戈,一...
    開封第一講書人閱讀 51,727評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音孙乖,去河邊找鬼浙炼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛唯袄,可吹牛的內(nèi)容都是我干的弯屈。 我是一名探鬼主播,決...
    沈念sama閱讀 40,447評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼恋拷,長吁一口氣:“原來是場噩夢啊……” “哼资厉!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起蔬顾,我...
    開封第一講書人閱讀 39,349評(píng)論 0 276
  • 序言:老撾萬榮一對情侶失蹤宴偿,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后诀豁,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體窄刘,經(jīng)...
    沈念sama閱讀 45,820評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,990評(píng)論 3 337
  • 正文 我和宋清朗相戀三年舷胜,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了都哭。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,127評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡逞带,死狀恐怖欺矫,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情展氓,我是刑警寧澤穆趴,帶...
    沈念sama閱讀 35,812評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站遇汞,受9級(jí)特大地震影響未妹,放射性物質(zhì)發(fā)生泄漏簿废。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,471評(píng)論 3 331
  • 文/蒙蒙 一络它、第九天 我趴在偏房一處隱蔽的房頂上張望族檬。 院中可真熱鬧,春花似錦化戳、人聲如沸单料。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽扫尖。三九已至,卻和暖如春掠廓,著一層夾襖步出監(jiān)牢的瞬間换怖,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評(píng)論 1 272
  • 我被黑心中介騙來泰國打工蟀瞧, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留沉颂,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,388評(píng)論 3 373
  • 正文 我出身青樓悦污,卻偏偏與公主長得像兆览,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子塞关,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,066評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容