flink使用07-通過join合并流的操作

Flink 中支持窗口上的多流合并, 需要保證的是輸入的 stream 要構(gòu)建在相同的 Window 上, 并使用相同類型的 Key 作為關(guān)聯(lián)條件.代碼如下所示, 先通過 join 方法將 inputStream1 數(shù)據(jù)集和 inputStream2 關(guān)聯(lián), 調(diào)用 where( ) 方法指定 inputStream1 的 key, 調(diào)用 equalTo( ) 方法指定 inputStream2 對(duì)應(yīng)關(guān)聯(lián)的 key. 通過 window( ) 方法指定 window Assigner, 最后再通過 apply( ) 方法傳入用戶自定義的 JoinFunction 或者 FlatJoinFunction 對(duì)輸入的數(shù)據(jù)元素做窗口計(jì)算.

inputStream1.join(inputStream2)
            // 指定inputStream1的關(guān)聯(lián)key
            .where(0)
            // 指定inputStream2的關(guān)聯(lián)key
            .equalTo(1)
            // 指定 window Assigner
            .window(TumblingEventTimeWindows.of(Time.seconds(10)))
            // 指定窗口計(jì)算函數(shù)
            .apply(<JoinFunction>)

下面就用 flink 官方倉庫中的join example來做演示, 完整代碼見倉庫 -> code link

樣例中有兩個(gè)流, 分別記錄的是員工的等級(jí)和員工的薪水, 流中數(shù)據(jù)的格式分別是 (name, grade) / (name, salary), 代碼實(shí)現(xiàn)的功能是合并兩個(gè)流, 轉(zhuǎn)變?yōu)?(name, grade, salary) 格式的流.

        final long windowSize = 200L;
        final long rate = 3L;

        System.out.println("Using windowSize=" + windowSize + ", data rate=" + rate);
        System.out.println("To customize example, use: WindowJoin [--windowSize <window-size-in-millis>] [--rate <elements-per-second>]");

        // 獲取env, 配置為"ingestion time"
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setStreamTimeCharacteristic(TimeCharacteristic.IngestionTime);


        // 生成 grade 和 salary 兩個(gè)流 分別是 (name, grade) / (name, salary)
        DataStream<Tuple2<String, Integer>> grades = WindowJoinSampleData.GradeSource.getSource(env, rate);
        DataStream<Tuple2<String, Integer>> salaries = WindowJoinSampleData.SalarySource.getSource(env, rate);

        DataStream<Tuple3<String, Integer, Integer>> joinedStream = runWindowJoin(grades, salaries, windowSize);

        joinedStream.print().setParallelism(1);

        env.execute("Windowed Join Example");

其中, 數(shù)據(jù)流的添加是通過一個(gè)Iterator 不停的添加進(jìn)去的, 具體的 join 邏輯通過 runWindowJoin( )方法, 以為為該方法的具體內(nèi)容

public static DataStream<Tuple3<String, Integer, Integer>> runWindowJoin(
            DataStream<Tuple2<String, Integer>> grades,
            DataStream<Tuple2<String, Integer>> salaries,
            long windowSize) {

        return grades.join(salaries)
                .where(new NameKeySelector())
                .equalTo(new NameKeySelector())

                .window(TumblingEventTimeWindows.of(Time.milliseconds(windowSize)))

                .apply(new JoinFunction<Tuple2<String, Integer>, Tuple2<String, Integer>, Tuple3<String, Integer, Integer>>() {

                    @Override
                    public Tuple3<String, Integer, Integer> join(
                            Tuple2<String, Integer> first,
                            Tuple2<String, Integer> second) {
                        return new Tuple3<String, Integer, Integer>(first.f0, first.f1, second.f1);
                    }
                });
    }
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末奸鬓,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,039評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡症歇,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門谭梗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來忘晤,“玉大人,你說我怎么就攤上這事激捏∩杷” “怎么了?”我有些...
    開封第一講書人閱讀 165,417評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵远舅,是天一觀的道長闰蛔。 經(jīng)常有香客問我,道長图柏,這世上最難降的妖魔是什么序六? 我笑而不...
    開封第一講書人閱讀 58,868評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮蚤吹,結(jié)果婚禮上例诀,老公的妹妹穿的比我還像新娘随抠。我一直安慰自己,他們只是感情好繁涂,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,892評(píng)論 6 392
  • 文/花漫 我一把揭開白布拱她。 她就那樣靜靜地躺著,像睡著了一般扔罪。 火紅的嫁衣襯著肌膚如雪秉沼。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,692評(píng)論 1 305
  • 那天步势,我揣著相機(jī)與錄音氧猬,去河邊找鬼背犯。 笑死坏瘩,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的漠魏。 我是一名探鬼主播倔矾,決...
    沈念sama閱讀 40,416評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼柱锹!你這毒婦竟也來了哪自?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,326評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤禁熏,失蹤者是張志新(化名)和其女友劉穎壤巷,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體瞧毙,經(jīng)...
    沈念sama閱讀 45,782評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡胧华,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,957評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了宙彪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片矩动。...
    茶點(diǎn)故事閱讀 40,102評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖释漆,靈堂內(nèi)的尸體忽然破棺而出悲没,到底是詐尸還是另有隱情,我是刑警寧澤男图,帶...
    沈念sama閱讀 35,790評(píng)論 5 346
  • 正文 年R本政府宣布示姿,位于F島的核電站,受9級(jí)特大地震影響逊笆,放射性物質(zhì)發(fā)生泄漏栈戳。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,442評(píng)論 3 331
  • 文/蒙蒙 一览露、第九天 我趴在偏房一處隱蔽的房頂上張望荧琼。 院中可真熱鬧,春花似錦、人聲如沸命锄。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽脐恩。三九已至镐侯,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間驶冒,已是汗流浹背苟翻。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評(píng)論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留骗污,地道東北人崇猫。 一個(gè)月前我還...
    沈念sama閱讀 48,332評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像需忿,于是被迫代替她去往敵國和親诅炉。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,044評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容