Flume實戰(zhàn)之Taildir

1殖属、背景

  • 將data路徑下所有日志文件通過Flume采集到HDFS上
  • 五分鐘一個目錄,一分鐘形成一個文件

2铅乡、技術選型

flume中有三種可監(jiān)控文件或目錄的source宏怔,分別問exec、spooldir阔蛉、taildir
exec:可通過tail -f命令去tail住一個文件弃舒,然后實時同步日志到sink
spooldir:可監(jiān)聽一個目錄,同步目錄中的新文件到sink,被同步完的文件可被立即刪除或被打上標記状原。適合用于同步新文件聋呢,但不適合對實時追加日志的文件進行監(jiān)聽并同步。
taildir:可實時監(jiān)控一批文件颠区,并記錄每個文件最新消費位置削锰,agent進程重啟后不會有重復消費的問題。
故本次選擇 taildir - file - HDFS

3毕莱、配置agent

vi taildir-file-hdfs.conf 
#agent_name
a1.sources=r1
a1.sinks=k1
a1.channels=c1

#source的配置
# source類型
a1.sources.r1.type = TAILDIR
# 元數(shù)據(jù)位置
a1.sources.r1.positionFile = /home/hadoop/data/bd/taildir_position.json
# 監(jiān)控的目錄
a1.sources.r1.filegroups = f1
a1.sources.r1.filegroups.f1=/home/hadoop/data/bd/.*log
a1.sources.r1.fileHeader = true
a1.sources.r1.interceptors = i1
a1.sources.r1.interceptors.i1.type = timestamp

#sink的配置
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path = hdfs://hadoop001:9000/offline/%Y%m%d/%H%M
a1.sinks.k1.hdfs.useLocalTimeStamp = true
a1.sinks.k1.hdfs.filePrefix = bd
a1.sinks.k1.hdfs.fileSuffix = .log
a1.sinks.k1.hdfs.rollSize =67108864
a1.sinks.k1.hdfs.rollCount = 0
a1.sinks.k1.hdfs.rollInterval = 60
a1.sinks.k1.hdfs.round = true
a1.sinks.k1.hdfs.roundValue = 5
a1.sinks.k1.hdfs.roundUnit = minute
a1.sinks.k1.hdfs.minBlockReplicas = 1
a1.sinks.k1.hdfs.writeFormat = Text
a1.sinks.k1.hdfs.fileType=DataStream

#channel的配置
a1.channels.c1.type = file
a1.channels.c1.checkpointDir = /home/hadoop/data/checkpoint
a1.channels.c1.dataDirs = /home/hadoop/data
a1.channels.c1.capacity = 10000000
a1.channels.c1.transactionCapacity = 5000

#用channel鏈接source和sink
a1.sources.r1.channels = c1
a1.sinks.k1.channel =c1

4器贩、啟動flume

./flume-ng agent \
--name a1 \
--conf $FLUME_HOME/conf \
--conf-file /home/hadoop/script/flume/taildir-file-hdfs.conf \
-Dflume.root.logger=INFO,console

5、模擬業(yè)務數(shù)據(jù)

  • 編寫shell腳本
vi 1.sh
#!/bin/bash
cat /home/hadoop/data/bd/1.log >> /home/hadoop/data/bd/bd.log
cat /home/hadoop/data/bd/2.log >> /home/hadoop/data/bd/bd.log
cat /home/hadoop/data/bd.log >> /home/hadoop/data/bd/bd.log
cat /home/hadoop/data/bd.log >> /home/hadoop/data/bd/bd1.log
cat /home/hadoop/data/bd/1.log >> /home/hadoop/data/bd/bd1.log
cat /home/hadoop/data/bd/2.log >> /home/hadoop/data/bd/bd1.log
cat /home/hadoop/data/bd/1.log >> /home/hadoop/data/bd/bd2.log
cat /home/hadoop/data/bd/2.log >> /home/hadoop/data/bd/bd2.log
  • 編輯crontab朋截,添加每分鐘執(zhí)行1.sh
[hadoop@hadoop001 data]$ chmod +x 1.sh
[hadoop@hadoop001 data]$ crontab -e
* * * * * sh /home/hadoop/data/1.sh 

6蛹稍、5分鐘后查看HDFS的webui

文件夾目錄
文件目錄
最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市部服,隨后出現(xiàn)的幾起案子唆姐,更是在濱河造成了極大的恐慌,老刑警劉巖饲宿,帶你破解...
    沈念sama閱讀 212,816評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件厦酬,死亡現(xiàn)場離奇詭異,居然都是意外死亡瘫想,警方通過查閱死者的電腦和手機仗阅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來国夜,“玉大人减噪,你說我怎么就攤上這事〕荡担” “怎么了筹裕?”我有些...
    開封第一講書人閱讀 158,300評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長窄驹。 經(jīng)常有香客問我朝卒,道長,這世上最難降的妖魔是什么乐埠? 我笑而不...
    開封第一講書人閱讀 56,780評論 1 285
  • 正文 為了忘掉前任抗斤,我火速辦了婚禮囚企,結果婚禮上,老公的妹妹穿的比我還像新娘瑞眼。我一直安慰自己龙宏,他們只是感情好,可當我...
    茶點故事閱讀 65,890評論 6 385
  • 文/花漫 我一把揭開白布伤疙。 她就那樣靜靜地躺著银酗,像睡著了一般。 火紅的嫁衣襯著肌膚如雪徒像。 梳的紋絲不亂的頭發(fā)上黍特,一...
    開封第一講書人閱讀 50,084評論 1 291
  • 那天,我揣著相機與錄音厨姚,去河邊找鬼衅澈。 笑死键菱,一個胖子當著我的面吹牛谬墙,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播经备,決...
    沈念sama閱讀 39,151評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼拭抬,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了侵蒙?” 一聲冷哼從身側響起造虎,我...
    開封第一講書人閱讀 37,912評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎纷闺,沒想到半個月后算凿,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,355評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡犁功,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,666評論 2 327
  • 正文 我和宋清朗相戀三年氓轰,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片浸卦。...
    茶點故事閱讀 38,809評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡署鸡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出限嫌,到底是詐尸還是另有隱情靴庆,我是刑警寧澤,帶...
    沈念sama閱讀 34,504評論 4 334
  • 正文 年R本政府宣布怒医,位于F島的核電站炉抒,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏稚叹。R本人自食惡果不足惜焰薄,卻給世界環(huán)境...
    茶點故事閱讀 40,150評論 3 317
  • 文/蒙蒙 一禽笑、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蛤奥,春花似錦佳镜、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至缅刽,卻和暖如春啊掏,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背衰猛。 一陣腳步聲響...
    開封第一講書人閱讀 32,121評論 1 267
  • 我被黑心中介騙來泰國打工迟蜜, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人啡省。 一個月前我還...
    沈念sama閱讀 46,628評論 2 362
  • 正文 我出身青樓娜睛,卻偏偏與公主長得像,于是被迫代替她去往敵國和親卦睹。 傳聞我的和親對象是個殘疾皇子畦戒,可洞房花燭夜當晚...
    茶點故事閱讀 43,724評論 2 351