Dr-elephant安裝說明文檔

Dr-elephant安裝說明文檔

1. 前言

“大象醫(yī)生”是LinkedIn推出的一款Hadoop和Spark性能調(diào)節(jié)工具彼城,它能夠自動收集Hadoop平臺所有的度量標(biāo)準(zhǔn)聘裁,并對收集的數(shù)據(jù)進行分析此再,并將分析結(jié)果以一種簡單且易于理解的形式展示出來。這款工具將更好的幫助用戶理解蚜印、分析并提高他們的工作效率循捺。其中主要核心的東西是它定義了一系列的啟發(fā)式算法(Heuristics)稼锅,這些算法提供了對Hadoop/Spark任務(wù)進行性能分析的功能,這些啟發(fā)式算法都是基于一定的Hadoop/Spark任務(wù)調(diào)優(yōu)規(guī)則而設(shè)計的僚纷,而且這些啟發(fā)式算法被設(shè)計成插件式的矩距、可配置的。用戶可以自定義這個規(guī)則或者配置新的參數(shù)來適應(yīng)自己公司的開發(fā)環(huán)境畔濒。

2. 安裝步驟

Linkedln為了讓更多的用戶使用這款產(chǎn)品時能更貼切的適用于自己公司的開發(fā)環(huán)境剩晴,他們只提供源碼,用戶必須自己根據(jù)Hadoop版本跟Spark版本編譯源碼生成安裝包侵状。

2.1 下載源碼赞弥,準(zhǔn)備編譯環(huán)境
$> git clone https://github.com/linkedin/dr-elephant.git
$> cd dr-elephant*

因為這款產(chǎn)品是用play框架搭建的,使用了scala跟java語言趣兄,所以需要準(zhǔn)備play的環(huán)境绽左。下載地址:https://downloads.typesafe.com/typesafe-activator/1.3.12/typesafe-activator-1.3.12.zip

$> wget https://downloads.typesafe.com/typesafe-activator/1.3.12/typesafe-activator-1.3.12.zip
$> unzip typesafe-activator-1.3.12.zip 
#添加環(huán)境變量
$> export PLAY_HOME=/opt/soft/activator-dist-1.3.12
$> export PATH=${JAVA_HOME}/bin:${PLAY_HOME}/bin:$PATH
2.2 修改配置文件,編譯源碼
$> cd dr-elephant
$> vim compile.conf
#將Hadoop版本跟Spark版本改為跟生產(chǎn)一致
hadoop_version=2.6.0
spark_version=1.6.0
$> ./compile.sh(開始編譯)
2.3 編譯完成會在dist目錄下面生成安裝包艇潭。將安裝包copy到要部署的服務(wù)器上拼窥。(最好選擇跟jobhistoty一臺的服務(wù)器,免得后面出現(xiàn)拒絕連接的錯誤蹋凝。)
$> cd dist
$> scp dr-elephant-2.0.6.zip root@172.28.3.151:/opt/soft
$> cd /opt/soft
$> unzip dr-elephant-2.0.6.zip 
$> cd dr-elephant-2.0.6
2.4 配置app-conf/elephant.conf鲁纠,conf/evolutions/default/1.sql等文件
elephant.conf(配置數(shù)據(jù)庫信息,這里要求只能是mysql的鳍寂,且版本必須在5.5以上改含,建議安裝mariadb 10.0,相關(guān)文檔http://www.reibang.com/p/61e9cbd1b675)
# Database configuration
db_url=master01
db_name=drelephant
db_user=root
db_password=root
1.sql(這里要修改幾個字段的索引長度迄汛。(因為暫時的mysql還不支持很長字符的索引))
create index yarn_app_result_i4 on yarn_app_result (flow_exec_id(100));
create index yarn_app_result_i5 on yarn_app_result (job_def_id(100));
create index yarn_app_result_i6 on yarn_app_result (flow_def_id(100));
#這里還需要配置一下Hadoop跟spark的環(huán)境
$> vim /etc/profile
export HADOOP_HOME=/opt/cloudera/parcels/CDH/lib/hadoop
export HADOOP_CONF_DIR=/opt/cloudera/parcels/CDH/lib/hadoop/etc/hadoop
export SPARK_HOME=/opt/cloudera/parcels/CDH/lib/spark
export SPARK_CONF_DIR=/opt/cloudera/parcels/CDH/lib/spark/conf
(如果在這里配置后捍壤,程序啟動報錯還是找不到配置文件,就將這幾個配置加到程序的啟動腳本bin/start.sh)鞍爱。
2.5 啟動服務(wù)鹃觉,查看日志
$> bin/start.sh
#這里值得注意的是程序啟動后會產(chǎn)生3個日志文件,一個dr.log(程序啟動過程中的日志)睹逃,一個logs/application.log(程序啟動過程中的結(jié)果)盗扇,最后一個最重要的是程序啟動后的各種運行日志,這個日志的路徑比較奇怪唯卖,在跟dr-elephant-2.0.6同級的目錄下會產(chǎn)生一個logs/elephant/dr_elephant.log(日志會每天生成一個)粱玲,這里面的內(nèi)容才是驗證程序具體的問題的地方。
2.6 登錄頁面拜轨,查看任務(wù)狀態(tài)

http://172.28.3.151:8083/(這里我修改了web的端口,配置在app-conf/elephant.conf中)

dr——1.png

主頁顯示的是今天最緊集群跑的任務(wù)允青。

dr_2.png

search頁面可以查看歷史任務(wù)的執(zhí)行情況橄碾。

具體的使用方法單獨出一個使用文檔卵沉,下面說一下安裝過程中的坑。

3. 編譯過程的錯誤整理

3.1 sbt模塊報錯
sbt.ResolveException: unresolved dependency: commons-codec#commons-codec;1.8: org.apache#apache;13!apache.pom(pom.original) origin location must be absolute: file:/Users/rvesse/.m2/repository/org/apache/apache/13/apache-13.pom

處理方式: 刪除~/.ivy2整個目錄法牲,重編譯即可史汗。

3.2 前端框架node安裝報錯。

首先該項目需要編譯web模塊故需要安裝node環(huán)境(http://www.reibang.com/p/bef810c33721)拒垃,另外安裝完之后停撞,可能出現(xiàn)bower install 安裝失敗,這個可以跳過悼瓮。

node_1.png

4. 使用過程中的問題整理

4.1 索引過長
Specified key was too long; max key length is 767 bytes [ERROR:1071, SQLSTATE:42000]”戈毒, “Database 'default' is in an inconsistent state!

解決方式:出現(xiàn)這個錯誤就是dr-elephant在建索引時,索引長度太大造成的横堡。按照2.4步驟配置就不會出現(xiàn)這類問題埋市。

4.2 Tez模塊報錯

[圖片上傳中...(tez1.png-5e31d9-1535539755179-0)]

這個是因為最新版的dr-elephant引入了tez計算模型,到那時我們生產(chǎn)測試集群都沒有使用命贴,導(dǎo)致連接拒絕道宅。

解決方式:修改 app-conf/FetcherConf.xml文件,注釋掉tez fetcher相關(guān)的配置

 <!--
    <fetcher>
        <applicationtype>tez</applicationtype>
        <classname>com.linkedin.drelephant.tez.fetchers.TezFetcher</classname>
     </fetcher>
   -->
4.3 能獲取mapreduce任務(wù)并分析胸蛛,但是spark任務(wù)fetch不了污茵。原因是dr-elephant采用的是分析spark history中任務(wù)日志的壓縮格式,而spark history 默認是不對日志進行壓縮的葬项,所以需要修改泞当。
spark1.png

解決方式:修改spark history配置文件,讓它支持壓縮玷室。在CM界面零蓉,spark-->配置-->Gateway-->高級-->spark-conf/spark-defaults.conf 在這個代碼框中加入:spark.eventLog.compress=true。然后重啟spark相關(guān)組件穷缤,讓設(shè)置生效敌蜂。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市津肛,隨后出現(xiàn)的幾起案子章喉,更是在濱河造成了極大的恐慌,老刑警劉巖身坐,帶你破解...
    沈念sama閱讀 211,639評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件秸脱,死亡現(xiàn)場離奇詭異,居然都是意外死亡部蛇,警方通過查閱死者的電腦和手機摊唇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,277評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來涯鲁,“玉大人巷查,你說我怎么就攤上這事有序。” “怎么了岛请?”我有些...
    開封第一講書人閱讀 157,221評論 0 348
  • 文/不壞的土叔 我叫張陵旭寿,是天一觀的道長。 經(jīng)常有香客問我崇败,道長盅称,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,474評論 1 283
  • 正文 為了忘掉前任后室,我火速辦了婚禮缩膝,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘咧擂。我一直安慰自己逞盆,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,570評論 6 386
  • 文/花漫 我一把揭開白布松申。 她就那樣靜靜地躺著云芦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪贸桶。 梳的紋絲不亂的頭發(fā)上舅逸,一...
    開封第一講書人閱讀 49,816評論 1 290
  • 那天,我揣著相機與錄音皇筛,去河邊找鬼琉历。 笑死,一個胖子當(dāng)著我的面吹牛水醋,可吹牛的內(nèi)容都是我干的旗笔。 我是一名探鬼主播,決...
    沈念sama閱讀 38,957評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼拄踪,長吁一口氣:“原來是場噩夢啊……” “哼蝇恶!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起惶桐,我...
    開封第一講書人閱讀 37,718評論 0 266
  • 序言:老撾萬榮一對情侶失蹤撮弧,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后姚糊,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體贿衍,經(jīng)...
    沈念sama閱讀 44,176評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,511評論 2 327
  • 正文 我和宋清朗相戀三年救恨,在試婚紗的時候發(fā)現(xiàn)自己被綠了贸辈。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,646評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡肠槽,死狀恐怖裙椭,靈堂內(nèi)的尸體忽然破棺而出躏哩,到底是詐尸還是另有隱情署浩,我是刑警寧澤揉燃,帶...
    沈念sama閱讀 34,322評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站筋栋,受9級特大地震影響炊汤,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜弊攘,卻給世界環(huán)境...
    茶點故事閱讀 39,934評論 3 313
  • 文/蒙蒙 一抢腐、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧襟交,春花似錦迈倍、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,755評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至焕梅,卻和暖如春迹鹅,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背贞言。 一陣腳步聲響...
    開封第一講書人閱讀 31,987評論 1 266
  • 我被黑心中介騙來泰國打工斜棚, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人该窗。 一個月前我還...
    沈念sama閱讀 46,358評論 2 360
  • 正文 我出身青樓弟蚀,卻偏偏與公主長得像,于是被迫代替她去往敵國和親酗失。 傳聞我的和親對象是個殘疾皇子义钉,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,514評論 2 348

推薦閱讀更多精彩內(nèi)容