Flume將 kafka 中的數(shù)據(jù)轉(zhuǎn)存到 HDFS 中

flume1.8 kafka Channel + HDFS sink(without sources)

將 kafka 中的數(shù)據(jù)轉(zhuǎn)存到 HDFS 中, 用作離線計算, flume 已經(jīng)幫我們實現(xiàn)了, 添加配置文件, 直接啟動 flume-ng 即可.

The Kafka channel can be used for multiple scenarios:

  1. With Flume source and sink - it provides a reliable and highly available channel for events
  2. With Flume source and interceptor but no sink - it allows writing Flume events into a Kafka topic, for use by other apps
  3. With Flume sink, but no source - it is a low-latency, fault tolerant way to send events from Kafka to Flume sinks such as HDFS, HBase or Solr
  • $FLUME_HOME/conf/kafka-hdfs.conf
# kafka Channel + HDFS sink(without sources)
a1.channels = c1
a1.sinks = k1

# 定義 KafkaChannel
a1.channels.c1.type = org.apache.flume.channel.kafka.KafkaChannel
a1.channels.c1.parseAsFlumeEvent = false
a1.channels.c1.kafka.bootstrap.servers = kafka-1:9092,kafka-2:9092,kafka-3:9092
a1.channels.c1.kafka.topic = user
a1.channels.c1.kafka.consumer.group.id = g1

# 定義 HDFS sink
a1.sinks.k1.channel = c1
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path = hdfs://hadoop-1:9000/flume/%Y%m%d/%H
a1.sinks.k1.hdfs.useLocalTimeStamp = true
a1.sinks.k1.hdfs.filePrefix = log
a1.sinks.k1.hdfs.fileType = DataStream
# 不按照條數(shù)生成文件
a1.sinks.k1.hdfs.rollCount = 0
# HDFS 上的文件達到128M 生成一個文件
a1.sinks.k1.hdfs.rollSize = 134217728
# HDFS 上的文件達到10分鐘生成一個文件
a1.sinks.k1.hdfs.rollInterval = 600

記得配 hosts

  • <u>添加 HDFS 相關jar包和配置文件</u>
commons-configuration-1.6.jar
commons-io-2.4.jar
hadoop-auth-2.8.3.jar
hadoop-common-2.8.3.jar
hadoop-hdfs-2.8.3.jar
hadoop-hdfs-client-2.8.3.jar
htrace-core4-4.0.1-incubating.jar
core-site.xml
hdfs-site.xml
  • flume-1.8 kafka客戶端默認版本0.9 但是向上兼容(別用這個 有巨坑 _#)
    kafka-clients-2.0.0.jar kafka_2.11-2.0.0.jar

  • 先啟動 zookeeper kafka 和 HDFS(否則會各種報錯,)

  • 進入$FLUME_HOME啟動 flume
    root@common:/usr/local/flume# ./bin/flume-ng agent -c conf/ -f conf/kafka-hdfs.conf -n a1 -Dflume.root.logger=INFO,console

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末辆童,一起剝皮案震驚了整個濱河市兵迅,隨后出現(xiàn)的幾起案子决摧,更是在濱河造成了極大的恐慌,老刑警劉巖郁惜,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異歌懒,居然都是意外死亡具壮,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進店門梯刚,熙熙樓的掌柜王于貴愁眉苦臉地迎上來凉馆,“玉大人,你說我怎么就攤上這事亡资±焦玻” “怎么了?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵锥腻,是天一觀的道長嗦董。 經(jīng)常有香客問我,道長瘦黑,這世上最難降的妖魔是什么京革? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮幸斥,結(jié)果婚禮上匹摇,老公的妹妹穿的比我還像新娘。我一直安慰自己甲葬,他們只是感情好廊勃,可當我...
    茶點故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著经窖,像睡著了一般坡垫。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上钠至,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天葛虐,我揣著相機與錄音,去河邊找鬼棉钧。 笑死屿脐,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的宪卿。 我是一名探鬼主播的诵,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼佑钾!你這毒婦竟也來了西疤?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤休溶,失蹤者是張志新(化名)和其女友劉穎代赁,沒想到半個月后扰她,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡芭碍,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年徒役,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片窖壕。...
    茶點故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡忧勿,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出瞻讽,到底是詐尸還是另有隱情鸳吸,我是刑警寧澤,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布速勇,位于F島的核電站晌砾,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏烦磁。R本人自食惡果不足惜贡羔,卻給世界環(huán)境...
    茶點故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望个初。 院中可真熱鬧,春花似錦猴蹂、人聲如沸院溺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽珍逸。三九已至,卻和暖如春聋溜,著一層夾襖步出監(jiān)牢的瞬間谆膳,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工撮躁, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留漱病,地道東北人。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓把曼,卻偏偏與公主長得像杨帽,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子嗤军,可洞房花燭夜當晚...
    茶點故事閱讀 45,077評論 2 355