Spark 分析Json數(shù)據(jù)存入Mysql 遇到的坑

# Spark 分析Json數(shù)據(jù)存入Mysql 遇到的坑

折騰了兩天荤胁,終算是弄好了,入的坑不計(jì)其數(shù)屎债,但是也要數(shù)一數(shù)仅政。

坑(一)

之前搭建好了spark宫莱,就是簡(jiǎn)單的wordcount一下蒂誉,成功了也就沒在意。

這幾天重新拾起來虫给,一上來就記得 --master spark://master:55555

這個(gè)55555端口其實(shí)是我的hdfs的端口躯喇,結(jié)果給記成spark群集的了辫封,哇,很難受廉丽,一直卡住

說什么master不通倦微,查了半天,忽然想起怎么不加 --master這個(gè)配置反而執(zhí)行成功了正压,

查了一下不加 --master默認(rèn) --master local欣福,呀,緊跟著后邊 --master spark://master:7077

(默認(rèn)端口為7077)

~~~~~~~~~

恍然大悟蔑匣,很難受劣欢,這樣一來,通了裁良。凿将。。价脾。牧抵。

-------

坑(二)

```

17/04/30 13:37:29 INFO scheduler.TaskSchedulerImpl: Adding task set 0.0 with 2 tasks

17/04/30 13:37:44 WARN scheduler.TaskSchedulerImpl: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources

17/04/30 13:37:59 WARN scheduler.TaskSchedulerImpl: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources

```

查了一下,大體意思就是內(nèi)存不足,資源不足犀变。妹孙。。這個(gè)好辦获枝,改了一下配置文件蠢正,不知道起沒起作用,估計(jì)是沒起作用省店,

在spark目錄中的spark_env.sh中添加了export SPARK_EXECUTOR_MEMORY=512M

其實(shí)主要不在這里嚣崭,不加的話默認(rèn)為1G。

就是啟動(dòng)命令上我們 --executor-memory 1G 或者--executor-memory 512M 都沒問題懦傍,

--executor-memory 2G就有問題了雹舀。

這樣資源不足的問題也解決了。

-------

坑(三)

提交作業(yè)后粗俱,總是執(zhí)行一半卡住说榆,估計(jì)連一半也沒執(zhí)行,看了后臺(tái)的works 輸出日志寸认,

```

com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure

```

這錯(cuò)誤挺明顯的签财,就是數(shù)據(jù)庫連接失敗了。

開始思考废麻,是不是提交作業(yè)到群集每個(gè)slave上都需要一個(gè) mysql.jdbc包呢荠卷,試了一下模庐,

--jars /home/examples/mysql.jar 這個(gè)配置一開始就有烛愧,我只是在master上存在mysql.jdbc包,

于是把mysql.jdbc包放到slave的相同的位置掂碱。結(jié)果還是不行怜姿。。疼燥。

還是一樣的錯(cuò)誤沧卢。。醉者。

但狭。。撬即。立磁。。剥槐。唱歧。。。颅崩。几于。

一宿過去了。沿后。沿彭。。尖滚。膝蜈。。熔掺。饱搏。。

爬起來置逻,繼續(xù)干推沸,靈光一現(xiàn),券坞,鬓催,,恨锚,宇驾,,猴伶,

```

"jdbc:mysql://localhost:3306/"+mysql_database+"?user="+mysql_user+"&password="+mysql_password

```

scala中連接數(shù)據(jù)庫我是這樣寫的课舍,localhost的,有沒有他挎,發(fā)現(xiàn)問題了吧筝尾。。办桨。筹淫。

目前只是猜測(cè),呢撞,损姜,,殊霞,

我猜摧阅,slave向master連接數(shù)據(jù)庫時(shí)出現(xiàn)了問題。脓鹃。逸尖。。

slave上并沒有mysql,娇跟,岩齿,

我們需要把數(shù)據(jù)都存入master上,

試著把localhost改成master苞俘,盹沈,,吃谣,哇哦乞封。。岗憋。

成功了呢肃晚。。仔戈。关串。。

開心不

開心监徘。

-------

到上邊已經(jīng)算是結(jié)束了晋修。

過程中還有一坑,凰盔,墓卦,就是一開始自己寫了個(gè)wordcount結(jié)果存入mysql的小實(shí)驗(yàn),

```

val conf = new SparkConf().setAppName("RDDToMysql").setMaster("local")

```

配置這樣寫的户敬。落剪。。山叮。著榴。

我特么怎么說不管 --master spark 還是 --master local都成功。屁倔。。問題在這里呀暮胧。我該

寫成空配置

```

val conf = new SparkConf()

```

還有锐借,,往衷,钞翔,要處理json,席舍,布轿,sc.textFile肯定是不太好的,因?yàn)樗际且恍幸恍械淖x取的,

如果你的json數(shù)據(jù)不是規(guī)則的一行一個(gè)數(shù)據(jù)汰扭,那就完蛋了稠肘。

最好的方式就是讀取批量小文件 ,我們規(guī)定一個(gè)txt文件只有一條json數(shù)據(jù)萝毛。项阴。

直接讀取整個(gè)文件

sc.wholeTextFiles()完美

趕緊分析點(diǎn)有趣的數(shù)據(jù),笆包,环揽,哈哈

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市庵佣,隨后出現(xiàn)的幾起案子歉胶,更是在濱河造成了極大的恐慌,老刑警劉巖巴粪,帶你破解...
    沈念sama閱讀 218,036評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件跨扮,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡验毡,警方通過查閱死者的電腦和手機(jī)衡创,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來晶通,“玉大人璃氢,你說我怎么就攤上這事∈桑” “怎么了一也?”我有些...
    開封第一講書人閱讀 164,411評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)喉脖。 經(jīng)常有香客問我椰苟,道長(zhǎng),這世上最難降的妖魔是什么树叽? 我笑而不...
    開封第一講書人閱讀 58,622評(píng)論 1 293
  • 正文 為了忘掉前任舆蝴,我火速辦了婚禮,結(jié)果婚禮上题诵,老公的妹妹穿的比我還像新娘洁仗。我一直安慰自己,他們只是感情好性锭,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,661評(píng)論 6 392
  • 文/花漫 我一把揭開白布赠潦。 她就那樣靜靜地躺著,像睡著了一般草冈。 火紅的嫁衣襯著肌膚如雪她奥。 梳的紋絲不亂的頭發(fā)上瓮增,一...
    開封第一講書人閱讀 51,521評(píng)論 1 304
  • 那天,我揣著相機(jī)與錄音哩俭,去河邊找鬼绷跑。 笑死,一個(gè)胖子當(dāng)著我的面吹牛携茂,可吹牛的內(nèi)容都是我干的你踩。 我是一名探鬼主播,決...
    沈念sama閱讀 40,288評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼讳苦,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼带膜!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起鸳谜,我...
    開封第一講書人閱讀 39,200評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤膝藕,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后咐扭,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體芭挽,經(jīng)...
    沈念sama閱讀 45,644評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,837評(píng)論 3 336
  • 正文 我和宋清朗相戀三年蝗肪,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了袜爪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,953評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡薛闪,死狀恐怖辛馆,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情豁延,我是刑警寧澤昙篙,帶...
    沈念sama閱讀 35,673評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站诱咏,受9級(jí)特大地震影響苔可,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜袋狞,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,281評(píng)論 3 329
  • 文/蒙蒙 一焚辅、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧硕并,春花似錦法焰、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,889評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽乙濒。三九已至陕赃,卻和暖如春卵蛉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背么库。 一陣腳步聲響...
    開封第一講書人閱讀 33,011評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工傻丝, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人诉儒。 一個(gè)月前我還...
    沈念sama閱讀 48,119評(píng)論 3 370
  • 正文 我出身青樓葡缰,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親忱反。 傳聞我的和親對(duì)象是個(gè)殘疾皇子泛释,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,901評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容