Flink入門案例-WordCount流處理

一宗弯、maven項目的pom.xml中的依賴

   <properties>
        <flink.version>1.9.1</flink.version>
    </properties>
    <!--引入flink依賴-->
    <dependencies>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-java</artifactId>
            <version>${flink.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-java_2.12</artifactId>
            <version>${flink.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-cep_2.12</artifactId>
            <version>${flink.version}</version>
        </dependency>
    </dependencies>

二褐鸥、測試數(shù)據

input file path:./hello.txt

hello world
hello flink
hello spark
hello scala
how are you
fine thank you
and you

三、Flink WordCount Java版

package com.cn.wc;

import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.api.java.utils.ParameterTool;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.util.Collector;

public class StreamWordCount {
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        // 設置并行度
        env.setParallelism(2);
        String inputPath = "C:\\workstation\\maven_project\\flink_wordcount\\src\\main\\resources\\hello.txt";

        // DataStreamSource 繼承SingleOutputStreamOperator,其繼承DataStream
        // 從文件中讀取數(shù)據并模仿流式數(shù)據
        DataStreamSource<String> inputDataStream = env.readTextFile(inputPath);

        // 從socket(localhost:9000 可自己定義)文本流讀取數(shù)據
        // DataStreamSource<String> inputDataStream2 = env.socketTextStream("localhost", 9000);

        // 基于數(shù)據流進行轉換操作
        SingleOutputStreamOperator<Tuple2<String, Integer>> result = inputDataStream.flatMap(new FlatMapFunction<String, Tuple2<String, Integer>>() {
            public void flatMap(String s, Collector<Tuple2<String, Integer>> collector) throws Exception {
                String[] words = s.split(" ");
                for (String word : words) {
                    collector.collect(new Tuple2<String, Integer>(word, 1));
                }
            }
        })
        .keyBy(0) // 針對相同的word 合并,批處理groupby宇弛,流處理keyby
        .sum(1);
        result.print(); // 到這里不會輸出
        // 觸發(fā)流執(zhí)行任務
        env.execute();
    }
}

四步氏、運行結果

注:隨著流的不斷的觸發(fā)任務會不斷更新結果查辩。
2> (how,1)
1> (hello,1)
2> (you,1)
2> (fine,1)
1> (hello,2)
2> (you,2)
1> (hello,3)
2> (and,1)
1> (spark,1)
1> (hello,4)
2> (you,3)
1> (scala,1)
2> (world,1)
1> (are,1)
1> (thank,1)
2> (flink,1)

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末骏全,一起剝皮案震驚了整個濱河市与斤,隨后出現(xiàn)的幾起案子肪康,更是在濱河造成了極大的恐慌,老刑警劉巖撩穿,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件磷支,死亡現(xiàn)場離奇詭異,居然都是意外死亡食寡,警方通過查閱死者的電腦和手機雾狈,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來抵皱,“玉大人善榛,你說我怎么就攤上這事辩蛋。” “怎么了移盆?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵悼院,是天一觀的道長。 經常有香客問我咒循,道長据途,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任剑鞍,我火速辦了婚禮昨凡,結果婚禮上,老公的妹妹穿的比我還像新娘蚁署。我一直安慰自己便脊,他們只是感情好,可當我...
    茶點故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布光戈。 她就那樣靜靜地躺著哪痰,像睡著了一般。 火紅的嫁衣襯著肌膚如雪久妆。 梳的紋絲不亂的頭發(fā)上晌杰,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天,我揣著相機與錄音筷弦,去河邊找鬼肋演。 笑死,一個胖子當著我的面吹牛烂琴,可吹牛的內容都是我干的爹殊。 我是一名探鬼主播,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼奸绷,長吁一口氣:“原來是場噩夢啊……” “哼梗夸!你這毒婦竟也來了?” 一聲冷哼從身側響起号醉,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤反症,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后畔派,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體铅碍,經...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年线椰,在試婚紗的時候發(fā)現(xiàn)自己被綠了该酗。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖呜魄,靈堂內的尸體忽然破棺而出悔叽,到底是詐尸還是另有隱情,我是刑警寧澤爵嗅,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布娇澎,位于F島的核電站,受9級特大地震影響睹晒,放射性物質發(fā)生泄漏趟庄。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一伪很、第九天 我趴在偏房一處隱蔽的房頂上張望戚啥。 院中可真熱鬧,春花似錦锉试、人聲如沸猫十。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽拖云。三九已至,卻和暖如春应又,著一層夾襖步出監(jiān)牢的瞬間宙项,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工株扛, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留尤筐,地道東北人。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓洞就,卻偏偏與公主長得像叔磷,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子奖磁,可洞房花燭夜當晚...
    茶點故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內容

  • 今天感恩節(jié)哎,感謝一直在我身邊的親朋好友繁疤。感恩相遇咖为!感恩不離不棄。 中午開了第一次的黨會稠腊,身份的轉變要...
    迷月閃星情閱讀 10,566評論 0 11
  • 彩排完躁染,天已黑
    劉凱書法閱讀 4,218評論 1 3
  • 沒事就多看看書,因為腹有詩書氣自華架忌,讀書萬卷始通神吞彤。沒事就多出去旅游,別因為沒錢而找借口,因為只要你省吃儉用饰恕,來...
    向陽之心閱讀 4,784評論 3 11
  • 表情是什么挠羔,我認為表情就是表現(xiàn)出來的情緒。表情可以傳達很多信息埋嵌。高興了當然就笑了破加,難過就哭了。兩者是相互影響密不可...
    Persistenc_6aea閱讀 125,043評論 2 7