SparkStreaming從kafka讀取數(shù)據編碼問題(Java)

SparkStreaming從kafka讀取文件流時(Java)饭豹,默認是utf-8的,如果源文件的編碼不是utf-8务漩,那就會出現(xiàn)亂碼現(xiàn)象拄衰,但是kafka的官網參數(shù)里沒有關于編碼的參數(shù),不過kafka的源碼里面是有的饵骨。源碼如下:

class String Encoder(props:VerifiableProperties=null) extends Encoder[String]{

val encoding = if (props==null) "UTF8" else props.getString("serializer.encoding","UTF8")

?根據上面的源碼翘悉,設置serializer.encoding就可以了,經過測試宏悦,設置serializer.encoding確實是有效的镐确。下面是SparkStream從kafka讀取數(shù)據代碼:

...

HashSet_TopicsSet = newHashSet(Arrays.asList("a1_topic","a2_topic"));

Map_KafkaParams = new HashMap();

_KafkaParams.put("metadata.broker.list","dn1:9092,nn0:9092,dn0:9092");

_KafkaParams.put("group.id", "groupid");

_KafkaParams.put("fetch.message.max.bytes","5120000");

_KafkaParams.put("serializer.encoding", "gb18030");

JavaDStream_MessagesLines = KafkaUtils.createDirectStream(_JavaStreamingContext,String.class, String.class,StringDecoder.class,StringDecoder.class,_KafkaParams, _TopicsSet)

.map(newFunction, String>() {

publicString call(Tuple2 tuple2) {

returntuple2._2();

}

});

...

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市饼煞,隨后出現(xiàn)的幾起案子源葫,更是在濱河造成了極大的恐慌,老刑警劉巖砖瞧,帶你破解...
    沈念sama閱讀 211,561評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件息堂,死亡現(xiàn)場離奇詭異,居然都是意外死亡块促,警方通過查閱死者的電腦和手機荣堰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,218評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來竭翠,“玉大人振坚,你說我怎么就攤上這事≌牛” “怎么了渡八?”我有些...
    開封第一講書人閱讀 157,162評論 0 348
  • 文/不壞的土叔 我叫張陵啃洋,是天一觀的道長。 經常有香客問我宏娄,道長,這世上最難降的妖魔是什么逮壁? 我笑而不...
    開封第一講書人閱讀 56,470評論 1 283
  • 正文 為了忘掉前任孵坚,我火速辦了婚禮,結果婚禮上窥淆,老公的妹妹穿的比我還像新娘卖宠。我一直安慰自己,他們只是感情好祖乳,可當我...
    茶點故事閱讀 65,550評論 6 385
  • 文/花漫 我一把揭開白布逗堵。 她就那樣靜靜地躺著秉氧,像睡著了一般眷昆。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上汁咏,一...
    開封第一講書人閱讀 49,806評論 1 290
  • 那天亚斋,我揣著相機與錄音,去河邊找鬼攘滩。 笑死帅刊,一個胖子當著我的面吹牛,可吹牛的內容都是我干的漂问。 我是一名探鬼主播赖瞒,決...
    沈念sama閱讀 38,951評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼蚤假!你這毒婦竟也來了栏饮?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,712評論 0 266
  • 序言:老撾萬榮一對情侶失蹤磷仰,失蹤者是張志新(化名)和其女友劉穎袍嬉,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體灶平,經...
    沈念sama閱讀 44,166評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡伺通,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,510評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了逢享。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片罐监。...
    茶點故事閱讀 38,643評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖瞒爬,靈堂內的尸體忽然破棺而出弓柱,到底是詐尸還是另有隱情调缨,我是刑警寧澤,帶...
    沈念sama閱讀 34,306評論 4 330
  • 正文 年R本政府宣布吆你,位于F島的核電站弦叶,受9級特大地震影響,放射性物質發(fā)生泄漏妇多。R本人自食惡果不足惜伤哺,卻給世界環(huán)境...
    茶點故事閱讀 39,930評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望者祖。 院中可真熱鬧立莉,春花似錦、人聲如沸七问。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,745評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽械巡。三九已至刹淌,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間讥耗,已是汗流浹背有勾。 一陣腳步聲響...
    開封第一講書人閱讀 31,983評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留古程,地道東北人蔼卡。 一個月前我還...
    沈念sama閱讀 46,351評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像挣磨,于是被迫代替她去往敵國和親雇逞。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,509評論 2 348

推薦閱讀更多精彩內容

  • Spring Cloud為開發(fā)人員提供了快速構建分布式系統(tǒng)中一些常見模式的工具(例如配置管理茁裙,服務發(fā)現(xiàn)塘砸,斷路器,智...
    卡卡羅2017閱讀 134,633評論 18 139
  • Kafka入門經典教程-Kafka-about云開發(fā) http://www.aboutyun.com/threa...
    葡萄喃喃囈語閱讀 10,812評論 4 54
  • 一呜达、基本概念 介紹 Kafka是一個分布式的谣蠢、可分區(qū)的、可復制的消息系統(tǒng)查近。它提供了普通消息系統(tǒng)的功能眉踱,但具有自己獨...
    ITsupuerlady閱讀 1,627評論 0 9
  • 本文代碼格式不好調整,可以參考本人在其他地方的同篇博文 https://blog.csdn.net/russle/...
    不1見2不3散4閱讀 2,603評論 2 1
  • 在水佳人引瑟箏霜威,閑風懶月賴偷聲谈喳。 冰輪枉作圓時夜,不解相思怎話情戈泼?
    周延龍閱讀 456評論 0 14