Flink單流算子

DataStream

1. map/flatMap

  • MapFunction<T, O>
O map(T value) throws Exception;

輸入一個(gè)元素六荒,輸出一個(gè)元素护姆,其中包含了變換邏輯

  • RichMapFunction<IN, OUT>

繼承了MapFunction,可以獲取RuntimeContext掏击,用于查詢當(dāng)前算子當(dāng)前并發(fā)的運(yùn)行狀態(tài)卵皂、accumulator以及broadcast variables等。

  • FlatMapFunction<T, O>
void flatMap(T value, Collector<O> out) throws Exception;

輸入一個(gè)元素砚亭,輸出若干個(gè)元素(可以是0個(gè))灯变,其中包含了變換邏輯

  • RichFlatMapFunction<IN, OUT>

類似RichMapFunction

2. filter

  • FilterFunction<T>
    boolean filter(T value) throws Exception;
    包含篩選邏輯,需要保留的返回true捅膘,否則返回false

3. process

  • ProcessFunction<I, O>
void processElement(I value, Context ctx, Collector<O> out)

用于處理數(shù)據(jù)添祸,out用于向下游發(fā)射數(shù)據(jù),ctx則用于查詢時(shí)間戳寻仗、注冊(cè)TimerService等等刃泌,也可以獲取state用于暫時(shí)存儲(chǔ)數(shù)據(jù)

onTimer(long timestamp, OnTimerContext ctx, Collector<O> out)

注冊(cè)了TimerService后(同一個(gè)時(shí)間戳多次注冊(cè)只會(huì)觸發(fā)一次),當(dāng)watermark沒過這個(gè)時(shí)間戳?xí)r,就會(huì)觸發(fā)事件耙替,調(diào)用onTimer方法亚侠,可以執(zhí)行一些邏輯,比如把統(tǒng)計(jì)的結(jié)果合并成一條記錄俗扇,用out輸出等等

4. project

  • <R extends Tuple> SingleOutputStreamOperator<R> project(int... fieldIndexes)

只有Tuple才能這樣操作硝烂,就是將原來的Tuple映射成新的Tuple,fieldIndexes表示原來的Tuple中的數(shù)據(jù)的索引铜幽,取出的數(shù)據(jù)按fieldIndexes的順序滞谢,排成新的Tuple

5. windowAll / countWindowAll / timeWindowAll

表示以不同的方式獲取不分key的AllWindowedStream

6. addSink / print/printToErr / writeAsText / writeAsText / writeToSocket / writeUsingOutputFormat

各種花式輸出~

AllWindowedStream

1. reduce

將一個(gè)流的一個(gè)window的數(shù)據(jù)聚合成一個(gè)數(shù)據(jù),數(shù)據(jù)類型一致

  • ReduceFunction<T>
T reduce(T value1, T value2) throws Exception;

輸入兩個(gè)數(shù)據(jù)除抛,輸出一個(gè)數(shù)據(jù)狮杨,其中包含了歸并的邏輯,算子會(huì)不斷重復(fù)镶殷,直至剩下一個(gè)元素禾酱。用戶需要自己保證reduce方法的結(jié)果與元素的處理先后微酬、組合方式無關(guān)绘趋。

2. aggregate

將一個(gè)窗口的數(shù)據(jù)聚合成一條,與reduce類似颗管,但是更靈活

  • AggregateFunction<IN, ACC, OUT>
ACC createAccumulator();

創(chuàng)建一個(gè)累加器陷遮,用于保存狀態(tài),最好是增量的垦江,可以節(jié)約存儲(chǔ)帽馋,不用保存所有記錄

ACC add(IN value, ACC accumulator);

增加一個(gè)元素

OUT getResult(ACC accumulator);

從accumulator中獲得輸出元素

ACC merge(ACC a, ACC b);

用于合并accumulator,復(fù)用對(duì)象比吭,調(diào)用這個(gè)方法后绽族,之前的accumulator就不再用了

  • AllWindowFunction<IN, OUT, W extends Window>
void apply(W window, Iterable<IN> values, Collector<OUT> out) throws Exception;

用于將AggregateFunction中合并得到的的OUT 數(shù)據(jù)通過out輸出。這里的IN是AggregateFunction的OUT

  • ProcessAllWindowFunction<IN, OUT, W extends Window>
public abstract void process(Context context, Iterable<IN> elements, Collector<OUT> out) throws Exception;

與AllWindowFunction類似衩藤,但是多了可以使用context的功能

3. process

也使用ProcessAllWindowFunction吧慢,與aggregate不同的是,處理的是窗口中的每一個(gè)元素赏表,而不是聚合后的元素

4. apply

也使用ReduceFunction检诗、AllWindowFunction,與reduce瓢剿、aggregate不同的是逢慌,處理的是窗口中的每一個(gè)元素,而不是聚合后的元素

5. fold

FoldFunction<O, T>
T fold(T accumulator, O value) throws Exception;
與reduce间狂、aggregate類似攻泼,把每個(gè)數(shù)據(jù)都?xì)w并到一個(gè)accumulator中去,最后產(chǎn)生一個(gè)輸出數(shù)據(jù)

6. sum / min / max / minBy / maxBy

一些預(yù)定義好的聚合方法,按字面意思

7. sideOutputLateData

sideOutputLateData(OutputTag<T> outputTag)
將遲到的數(shù)據(jù)輸出坠韩,outputTag是輸出流的tag
可以通過SingleOutputStreamOperator#getSideOutput(OutputTag)來獲得遲到數(shù)據(jù)的流

KeyedStream

1. reduce

2. aggregate

3. process

4. fold

5. sum / min / max / minBy / maxBy

6. window / countWindow / timeWindow

方法的作用與DataStream類似距潘,表示以不同的方式獲取分key的WindowedStream

WindowedStream

1. reduce

2. aggregate

3. process

4. apply

5. fold

6. sum / min / max / minBy / maxBy

7. sideOutputLateData

方法的作用與AllWindowStream類似,只是作用于某個(gè)pane(也就是window中單獨(dú)的key的數(shù)據(jù))

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末只搁,一起剝皮案震驚了整個(gè)濱河市音比,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌氢惋,老刑警劉巖洞翩,帶你破解...
    沈念sama閱讀 217,907評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異焰望,居然都是意外死亡骚亿,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,987評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門熊赖,熙熙樓的掌柜王于貴愁眉苦臉地迎上來来屠,“玉大人,你說我怎么就攤上這事震鹉【愕眩” “怎么了?”我有些...
    開封第一講書人閱讀 164,298評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵传趾,是天一觀的道長(zhǎng)迎膜。 經(jīng)常有香客問我,道長(zhǎng)浆兰,這世上最難降的妖魔是什么磕仅? 我笑而不...
    開封第一講書人閱讀 58,586評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮簸呈,結(jié)果婚禮上榕订,老公的妹妹穿的比我還像新娘。我一直安慰自己蜕便,他們只是感情好劫恒,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,633評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著玩裙,像睡著了一般兼贸。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上吃溅,一...
    開封第一講書人閱讀 51,488評(píng)論 1 302
  • 那天溶诞,我揣著相機(jī)與錄音,去河邊找鬼决侈。 笑死螺垢,一個(gè)胖子當(dāng)著我的面吹牛喧务,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播枉圃,決...
    沈念sama閱讀 40,275評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼功茴,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了孽亲?” 一聲冷哼從身側(cè)響起坎穿,我...
    開封第一講書人閱讀 39,176評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎返劲,沒想到半個(gè)月后玲昧,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,619評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡篮绿,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,819評(píng)論 3 336
  • 正文 我和宋清朗相戀三年孵延,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片亲配。...
    茶點(diǎn)故事閱讀 39,932評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡尘应,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出吼虎,到底是詐尸還是另有隱情犬钢,我是刑警寧澤,帶...
    沈念sama閱讀 35,655評(píng)論 5 346
  • 正文 年R本政府宣布鲸睛,位于F島的核電站娜饵,受9級(jí)特大地震影響坡贺,放射性物質(zhì)發(fā)生泄漏官辈。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,265評(píng)論 3 329
  • 文/蒙蒙 一遍坟、第九天 我趴在偏房一處隱蔽的房頂上張望拳亿。 院中可真熱鬧,春花似錦愿伴、人聲如沸肺魁。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,871評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽鹅经。三九已至,卻和暖如春怎诫,著一層夾襖步出監(jiān)牢的瞬間瘾晃,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,994評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工幻妓, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蹦误,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,095評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像强胰,于是被迫代替她去往敵國(guó)和親舱沧。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,884評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容