flink WordCount初體驗(yàn)

這篇文章以flink官方local cluster教程為主線写烤,引導(dǎo)大家體驗(yàn)一下flink的初次開發(fā)。文章中所提到的代碼我已經(jīng)放到github上肄程,歡迎指正选浑。

下載和啟動(dòng)Flink

Flink可以運(yùn)行在Linux、Mac和Windows上拓提,唯一的要求就是必須安裝Java 8或以上版本隧膘∷卤梗可以使用一下命令查看:

(py2.7) bogon:flink-examples yss$ java -version
java version "1.8.0_181"
Java(TM) SE Runtime Environment (build 1.8.0_181-b13)
Java HotSpot(TM) 64-Bit Server VM (build 25.181-b13, mixed mode)

java安裝后去官網(wǎng)下載Flink蹦疑,然后解壓即可運(yùn)行。這里以flink-1.7.0為例艇肴。

cd ~/Downloads/
tar xzf flink-1.7.0-bin-scala_2.12.tgz
cd flink-1.7.0

以本地模式啟動(dòng)Flink

在flink目錄下運(yùn)行以下命令即可啟動(dòng)

 ./bin/start-cluster.sh  # Start Flink

這時(shí)候可以打開瀏覽器訪問http://localhost:8081
]flink的監(jiān)控頁(yè)面叁温。

flink.png

我們通過(guò)jps可以看到多出來(lái)兩個(gè)JVM進(jìn)程,運(yùn)行的主類StandaloneSessionClusterEntrypoint和TaskManagerRunner冲九。

[root@henghe-121 bin]# jps -l
16016 org.apache.flink.runtime.entrypoint.StandaloneSessionClusterEntrypoint
16513 org.apache.flink.runtime.taskexecutor.TaskManagerRunner
16619 sun.tools.jps.Jps

集群?jiǎn)?dòng)后就可以開發(fā)我們的flink程序了~

寫第一個(gè)Flink WorkCount程序

官網(wǎng)給出的Scala例子如下:

object SocketWindowWordCount {

    def main(args: Array[String]) : Unit = {

        // the port to connect to
        val port: Int = try {
            ParameterTool.fromArgs(args).getInt("port")
        } catch {
            case e: Exception => {
                System.err.println("No port specified. Please run 'SocketWindowWordCount --port <port>'")
                return
            }
        }

        // get the execution environment
        val env: StreamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment

        // get input data by connecting to the socket
        val text = env.socketTextStream("localhost", port, '\n')

        // parse the data, group it, window it, and aggregate the counts
        val windowCounts = text
            .flatMap { w => w.split("\\s") }
            .map { w => WordWithCount(w, 1) }
            .keyBy("word")
            .timeWindow(Time.seconds(5), Time.seconds(1))
            .sum("count")

        // print the results with a single thread, rather than in parallel
        windowCounts.print().setParallelism(1)

        env.execute("Socket Window WordCount")
    }

    // Data type for words with count
    case class WordWithCount(word: String, count: Long)
}

代碼本身不難,不過(guò)建立scala的Maven工程泳炉,打成可執(zhí)行jar還需要很多設(shè)置。在這里我將官方的例子配置做了很多簡(jiǎn)化氧腰,對(duì)于初學(xué)者更友好刨肃,并將代碼上傳到了github上。大家clone之后黄痪,直接運(yùn)行mvn clean package就可以生成jar包盔然。

運(yùn)行WordCount

對(duì)于這個(gè)例子首先要用netcat創(chuàng)建服務(wù),監(jiān)聽某個(gè)端口挺尾。

nc -l 9000

之后就可以提交job任務(wù)了

$ ./bin/flink run examples/streaming/SocketWindowWordCount.jar --port 9000
Starting execution of program

然后再nc端輸入要處理的字符串站绪,flink就可以拿到數(shù)據(jù)進(jìn)行處理

$ nc -l 9000
lorem ipsum
ipsum ipsum ipsum
bye

該任務(wù)的輸出在flink的log下以.out結(jié)尾的文件下。

$ tail -f flink-yss-taskexecutor-0-bogon.out
WordWithCount(hello,1)
WordWithCount(sdsd,1)
WordWithCount(sdsd,1)
WordWithCount(sss,1)

最后測(cè)試完可以關(guān)閉集群:

./bin/stop-cluster.sh
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末甫题,一起剝皮案震驚了整個(gè)濱河市涂召,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌麻顶,老刑警劉巖舱卡,帶你破解...
    沈念sama閱讀 219,270評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件轮锥,死亡現(xiàn)場(chǎng)離奇詭異要尔,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)既绩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門饲握,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)蚕键,“玉大人,你說(shuō)我怎么就攤上這事锣光。” “怎么了誊爹?”我有些...
    開封第一講書人閱讀 165,630評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)箍铭。 經(jīng)常有香客問我椎镣,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,906評(píng)論 1 295
  • 正文 為了忘掉前任刀崖,我火速辦了婚禮拍摇,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘充活。我一直安慰自己,他們只是感情好映穗,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,928評(píng)論 6 392
  • 文/花漫 我一把揭開白布幕随。 她就那樣靜靜地躺著蚁滋,像睡著了一般。 火紅的嫁衣襯著肌膚如雪赘淮。 梳的紋絲不亂的頭發(fā)上辕录,一...
    開封第一講書人閱讀 51,718評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音梢卸,去河邊找鬼走诞。 笑死,一個(gè)胖子當(dāng)著我的面吹牛蛤高,可吹牛的內(nèi)容都是我干的蚣旱。 我是一名探鬼主播,決...
    沈念sama閱讀 40,442評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼襟齿,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼姻锁!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起猜欺,我...
    開封第一講書人閱讀 39,345評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤位隶,失蹤者是張志新(化名)和其女友劉穎开皿,沒想到半個(gè)月后笋妥,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體春宣,經(jīng)...
    沈念sama閱讀 45,802評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,984評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了扁位。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片域仇。...
    茶點(diǎn)故事閱讀 40,117評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡沽讹,死狀恐怖爽雄,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情乘盖,我是刑警寧澤订框,帶...
    沈念sama閱讀 35,810評(píng)論 5 346
  • 正文 年R本政府宣布国旷,位于F島的核電站履羞,受9級(jí)特大地震影響骨杂,放射性物質(zhì)發(fā)生泄漏搓蚪。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,462評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望谎亩。 院中可真熱鬧匈庭,春花似錦阱持、人聲如沸衷咽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)裆赵。三九已至页藻,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間废境,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留堵泽,地道東北人迎罗。 一個(gè)月前我還...
    沈念sama閱讀 48,377評(píng)論 3 373
  • 正文 我出身青樓戴涝,卻偏偏與公主長(zhǎng)得像啥刻,于是被迫代替她去往敵國(guó)和親可帽。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,060評(píng)論 2 355