Spark 電商應(yīng)用開發(fā)過程中出現(xiàn)的問題匯總

1.java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.

報錯信息

描述: 出現(xiàn)這個問題并不妨礙程序繼續(xù)運行。
原因: HiveContext的創(chuàng)建依賴于本地的hadoop庫壁榕。

Exception具體問題

問題行

解決:
這邊的null其實是環(huán)境變量HADOOP_HOME矩屁，也就是依賴于HADOOP_HOME/bin/winutils.exe這個文件。

可以參考: https://blog.csdn.net/love666666shen/article/details/78812622

2.Task is not serializable.

任務(wù)不可序列化鳄袍。
原因: 一般是隨意使用Function外的變量展鸡，例如JavaSparkContext等又碌。因為完整main的代碼在Driver中執(zhí)行，而計算分片代碼在Spark的worker節(jié)點執(zhí)行尉咕，因此最好只保證算子數(shù)據(jù)的傳遞只有RDD或者DStream.

3.HiveContext報空指針

在Windows本地調(diào)試叠蝇，用HiveContext報空指針。
這個問題就需要本地的一個測試工具winutils.exe龙考。
因此問題3 == 問題1.具體問題可以參照問題1解決蟆肆。

參考: https://blog.csdn.net/u011817217/article/details/86593706

如果出現(xiàn)按以上方法依然無法解決或者還存在其他問題矾睦，可以直接把hive-site.xml扔到resources目錄，訪問虛擬機中的hive.

如上圖解決方法

注意窗口操作在SPARK<=1.6時炎功，只支持HiveContext枚冗，不支持SQLContext

4.ROW_NUMBER() OVER ( PARTITION BY ... ORDER BY ... )

select province,aid,clickCount from (select 
date,province,aid,clickCount,ROW_NUMBER() OVER ( 
PARTITION BY province ORDER BY click_count DESC) as rank 
from tmp_date_city_aid_clickCount ) as twhere rank <= 10

異常的語法錯誤

問題操作

原因:
https://www.e-learn.cn/content/wangluowenzhang/422390

Spark >= 2.0 時,HiveContext/SQLContext都支持窗口操作。
Spark <= 1.6 時,只有HiveContext 支持窗口操作蛇损。

解決:
我使用的版本為1.6赁温，SQLContext，因此導(dǎo)致了這個問題淤齐。因此必須使用HiveContext方能夠解決股囊。

5.SQLContext注冊臨時表的目錄無法刪除

ERROR ShutdownHookManager: Exception while deleting Spark temp dir

問題

這是個BUG: [SPAKR-8333] HiveContext創(chuàng)建的臨時目錄無法刪除「模可見任何軟件都有一定的問題和缺陷稚疹，需要我們不斷完善，為世界代碼業(yè)做貢獻祭务。
https://issues.apache.org/jira/browse/SPARK-8333?attachmentSortBy=dateTime

6.HiveContext : java.lang.RuntimeException: java.lang.RuntimeException: The root scratch dir: /tmp/hive on HDFS should be writable. Current permissions are: ---------

當(dāng)指定hive-site.xml時内狗，會使用線上的HDFS集群存儲本臨時文件，因此需要在resource下放入hdfs的配置文件义锥，還需要將hadoop上/tmp/hive/目錄創(chuàng)建并賦好權(quán)限柳沙。

image.png

7.部署問題 Exception in thread "main" java.lang.SecurityException: class "javax.servlet.FilterRegistration"'s signer information does not match signer information of other classes in the same package

image.png

原因: javax.servlet.FilterRegistration 在多個包中重復(fù)產(chǎn)生，導(dǎo)致沖突拌倍。
一般為這個依賴所致:

  <!-- hadoop相關(guān) -->
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-client</artifactId>
        <version>2.4.1</version>
        <exclusions>
            <exclusion>
                <groupId>javax.servlet</groupId>
                <artifactId>*</artifactId>
            </exclusion>
        </exclusions>
    </dependency>

解決就是加上如上的:

          <exclusions>
            <exclusion>
                <groupId>javax.servlet</groupId>
                <artifactId>*</artifactId>
            </exclusion>
        </exclusions>

8.HiveContext連接元數(shù)據(jù)庫mysql時連接數(shù)過多的問題赂鲤，我測試了一下，發(fā)現(xiàn)在DStream的Function中使用DataFrame進行sql查詢時候柱恤，不斷產(chǎn)生于hive元數(shù)據(jù)所在的mysql的連接数初。導(dǎo)致拋出“too many connections"異常。

連接數(shù)上限為150.png

看來默認的mysql的最大連接數(shù)max_connections=150,我修改/etc/my.cnf中max_connections為1000.觀察這種連接上漲是否有上限膨更。

image.png

重啟mysqld:

image.png

最后編輯于：2019.05.01 14:21:10

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末妙真，一起剝皮案震驚了整個濱河市缴允，隨后出現(xiàn)的幾起案子荚守，更是在濱河造成了極大的恐慌，老刑警劉巖练般，帶你破解...
沈念sama閱讀 218,204評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件矗漾，死亡現(xiàn)場離奇詭異，居然都是意外死亡薄料，警方通過查閱死者的電腦和手機敞贡，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,091評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來摄职，“玉大人誊役，你說我怎么就攤上這事获列。” “怎么了蛔垢？”我有些...
開封第一講書人閱讀 164,548評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵击孩，是天一觀的道長。經(jīng)常有香客問我鹏漆，道長巩梢，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,657評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任艺玲，我火速辦了婚禮括蝠，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘饭聚。我一直安慰自己忌警，他們只是感情好，可當(dāng)我...
茶點故事閱讀 67,689評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布秒梳。她就那樣靜靜地躺著慨蓝，像睡著了一般。火紅的嫁衣襯著肌膚如雪端幼。梳的紋絲不亂的頭發(fā)上礼烈，一...
開封第一講書人閱讀 51,554評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音婆跑，去河邊找鬼此熬。笑死，一個胖子當(dāng)著我的面吹牛滑进，可吹牛的內(nèi)容都是我干的犀忱。我是一名探鬼主播，決...
沈念sama閱讀 40,302評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼扶关，長吁一口氣：“原來是場噩夢啊……” “哼阴汇！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起节槐，我...
開封第一講書人閱讀 39,216評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤搀庶，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后铜异，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體哥倔，經(jīng)...
沈念sama閱讀 45,661評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,851評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年揍庄，在試婚紗的時候發(fā)現(xiàn)自己被綠了咆蒿。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,977評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖沃测，靈堂內(nèi)的尸體忽然破棺而出缭黔，到底是詐尸還是另有隱情，我是刑警寧澤蒂破，帶...
沈念sama閱讀 35,697評論 5贊 347
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布试浙，位于F島的核電站，受9級特大地震影響寞蚌，放射性物質(zhì)發(fā)生泄漏田巴。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,306評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一挟秤、第九天我趴在偏房一處隱蔽的房頂上張望壹哺。院中可真熱鬧筛璧，春花似錦溶其、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,898評論 0贊 22
一樁弒父案攀甚，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽箩朴。三九已至，卻和暖如春秋度，著一層夾襖步出監(jiān)牢的瞬間炸庞，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,019評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工荚斯，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留埠居，地道東北人。一個月前我還...
沈念sama閱讀 48,138評論 3贊 370
代替公主和親
正文我出身青樓事期，卻偏偏與公主長得像滥壕，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子兽泣，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,927評論 2贊 355

Spark 電商應(yīng)用開發(fā)過程中出現(xiàn)的問題匯總

1.java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.

2.Task is not serializable.

3.HiveContext報空指針

4.ROW_NUMBER() OVER ( PARTITION BY ... ORDER BY ... )

5.SQLContext注冊臨時表的目錄無法刪除

6.HiveContext : java.lang.RuntimeException: java.lang.RuntimeException: The root scratch dir: /tmp/hive on HDFS should be writable. Current permissions are: ---------

7.部署問題 Exception in thread "main" java.lang.SecurityException: class "javax.servlet.FilterRegistration"'s signer information does not match signer information of other classes in the same package

推薦閱讀更多精彩內(nèi)容