Spark交互式分析平臺(tái)Apache Zeppelin的安裝

Zeppelin介紹

Apache Zeppelin提供了web版的類似ipython的notebook抄沮,用于做數(shù)據(jù)分析和可視化榛鼎。背后可以接入不同的數(shù)據(jù)處理引擎辙诞,包括spark, hive, tajo等惧浴,原生支持scala, java, shell, markdown等瑟蜈。它的整體展現(xiàn)和使用形式和Databricks Cloud是一樣的塞俱,就是來自于當(dāng)時(shí)的demo姐帚。

Zeppelin可實(shí)現(xiàn)你所需要的:

  • 數(shù)據(jù)采集
  • 數(shù)據(jù)發(fā)現(xiàn)
  • 數(shù)據(jù)分析
  • 數(shù)據(jù)可視化和協(xié)作

支持多種語言,默認(rèn)是scala(背后是spark shell)障涯,SparkSQL, Markdown 和 Shell罐旗。


甚至可以添加自己的語言支持。如何寫一個(gè)zeppelin解釋器

Zeppelin特性

Apache Spark 集成

Zeppelin 提供了內(nèi)置的 Apache Spark 集成唯蝶。你不需要單獨(dú)構(gòu)建一個(gè)模塊九秀、插件或者庫。
Zeppelin的Spark集成提供了:

  • 自動(dòng)引入SparkContext 和 SQLContext
  • 從本地文件系統(tǒng)或maven庫載入運(yùn)行時(shí)依賴的jar包粘我。更多關(guān)于依賴載入器
  • 可取消job 和 展示job進(jìn)度

數(shù)據(jù)可視化

一些基本的圖表已經(jīng)包含在Zeppelin中鼓蜒。可視化并不只限于SparkSQL查詢,后端的任何語言的輸出都可以被識(shí)別并可視化友酱。
Bank

動(dòng)態(tài)表格
Zeppelin 可以在你的筆記本中動(dòng)態(tài)地創(chuàng)建一些輸入格式晴音。

協(xié)作
Notebook 的 URL 可以在協(xié)作者間分享。 Zeppelin 然后可以實(shí)時(shí)廣播任何變化缔杉,就像在 Google docs 中一樣锤躁。

發(fā)布
Zeppelin提供了一個(gè)URL用來僅僅展示結(jié)果,那個(gè)頁面不包括Zeppelin的菜單和按鈕或详。這樣系羞,你可以輕易地將其作為一個(gè)iframe集成到你的網(wǎng)站。

Zeppelin的安裝部署

由于Zeppelin目前不提供binary安裝包霸琴,所以這里Zeppelin的安裝需要自己編譯椒振。
這里可以參考Zeppelin GithubInstall Zeppelin

準(zhǔn)備工作

需要
Java 1.7
Tested on Mac OSX, Ubuntu 14.X, CentOS 6.X
Maven (if you want to build from the source code)
Node.js Package Manager

在Ubuntu環(huán)境下可以這樣安裝:

sudo apt-get update
sudo apt-get install openjdk-7-jdk
sudo apt-get install git
sudo apt-get install maven
sudo apt-get install npm

注意:這里的maven工具如果不是最新的源的話,可能只是maven2梧乘,zeppelin的編譯需要maven3澎迎,不然一些工具的下載會(huì)受到影響,可以從maven官網(wǎng)下載二進(jìn)制壓縮包选调,直接使用夹供。
這里還需要node命令,apt-get安裝npm時(shí)候會(huì)自動(dòng)安裝nodejs命令仁堪,這里只需要建立一個(gè)鏈接就可以:sudo ln -s /usr/bin/nodejs /usr/bin/node

zeppelin-web項(xiàng)目的安裝配置

我在之前對(duì)zeppelin整個(gè)項(xiàng)目進(jìn)行maven部署的時(shí)候總是出現(xiàn)zeppelin-web項(xiàng)目的失敗哮洽,不得其解,參照網(wǎng)上的方法弦聂,對(duì)zeppelin-web項(xiàng)目進(jìn)行單獨(dú)的安裝配置鸟辅。
這里每一步都很關(guān)鍵,我在這里的配置安裝折騰了很多次莺葫,最終才能正常的完成安裝匪凉,下面一一道來。

刪除zeppelin-web項(xiàng)目的pom.xml下面給出的內(nèi)容捺檬,換做手動(dòng)安裝:

<plugin>
        <groupId>com.github.eirslett</groupId>
        <artifactId>frontend-maven-plugin</artifactId>
        <version>0.0.23</version>
        <executions>

          <execution>
            <id>install node and npm</id>
            <goals>
              <goal>install-node-and-npm</goal>
            </goals>
            <configuration>
              <nodeVersion>v0.10.18</nodeVersion>
              <npmVersion>1.3.8</npmVersion>
            </configuration>
          </execution>
          <execution>
            <id>npm install</id>
            <goals>
              <goal>npm</goal>
            </goals>
          </execution>

          <execution>
            <id>bower install</id>
            <goals>
                <goal>bower</goal>
            </goals>
            <configuration>
              <arguments>--allow-root install</arguments>
            </configuration>
          </execution>

          <execution>
            <id>grunt build</id>
            <goals>
                <goal>grunt</goal>
            </goals>
            <configuration>
              <arguments>--no-color --force</arguments>
            </configuration>
          </execution>
        </executions>
      </plugin>

手動(dòng)安裝步驟:
1. 安裝好npm和node
2. 進(jìn)入zeppelin-web目錄下洒缀,執(zhí)行npm install。它會(huì)根據(jù)package.json的描述安裝一些grunt的組件欺冀,安裝bower,然后再目錄下生產(chǎn)一個(gè)node_modules目錄萨脑。
3. 執(zhí)行bower –-allow-root install隐轩,會(huì)根據(jù)bower.json安裝前段庫依賴,有點(diǎn)類似于java的mvn渤早。
4. 執(zhí)行grunt --no-color –-force职车,會(huì)根據(jù)Gruntfile.js整理web文件。
第3、4步要注意悴灵,本來給定的bower和grunt文件中使用的"node/node"命令扛芽,因?yàn)槭褂胢aven自動(dòng)安裝時(shí),會(huì)在當(dāng)前目錄下生成node目錄积瞒,其中包含node命令川尖。我們之前已經(jīng)安裝了nodejs命令,并新鏈接了命令node茫孔,所以這里需要將其修改為"node"叮喳。
5. 執(zhí)行mvn install -DskipTests,把web項(xiàng)目打包缰贝,在target目錄下會(huì)生成war
pom.xml在生成war包的時(shí)候馍悟,要參照dist\WEB-INF\web.xml文件,所以在執(zhí)行該步驟之前剩晴,要明確zeppelin-web目錄下由dist目錄锣咒,才能最終生成正確的war包。

其他zeppelin項(xiàng)目的編譯

其他項(xiàng)目的編譯依照正常程序進(jìn)行就可以赞弥,安裝文檔:http://zeppelin.incubator.apache.org/docs/install/install.html

根據(jù)自己的方式進(jìn)行編譯:
Local mode:
mvn install -DskipTests
Cluster mode:
mvn install -DskipTests -Dspark.version=1.1.0 -Dhadoop.version=2.2.0

配置

配置文件為環(huán)境變量文件(conf/zeppelin-env.sh)和Java屬性文件(conf/zeppelin-site.xml)毅整。根據(jù)自己的要求進(jìn)行配置。

啟動(dòng)嗤攻、關(guān)閉

啟動(dòng)毛嫉、關(guān)閉Zeppelin進(jìn)程命令為:
bin/zeppelin-daemon.sh start
bin/zeppelin-daemon.sh stop

參考資料

Apache Zeppelin安裝及介紹

轉(zhuǎn)載請(qǐng)注明作者Jason Ding及其出處
GitCafe博客主頁(http://jasonding1354.gitcafe.io/)
Github博客主頁(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡(jiǎn)書主頁(http://www.reibang.com/users/2bd9b48f6ea8/latest_articles)
Google搜索jasonding1354進(jìn)入我的博客主頁

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市妇菱,隨后出現(xiàn)的幾起案子承粤,更是在濱河造成了極大的恐慌,老刑警劉巖闯团,帶你破解...
    沈念sama閱讀 218,451評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件辛臊,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡房交,警方通過查閱死者的電腦和手機(jī)彻舰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,172評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來候味,“玉大人刃唤,你說我怎么就攤上這事“兹海” “怎么了尚胞?”我有些...
    開封第一講書人閱讀 164,782評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)帜慢。 經(jīng)常有香客問我笼裳,道長(zhǎng)唯卖,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,709評(píng)論 1 294
  • 正文 為了忘掉前任躬柬,我火速辦了婚禮拜轨,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘允青。我一直安慰自己橄碾,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,733評(píng)論 6 392
  • 文/花漫 我一把揭開白布昧廷。 她就那樣靜靜地躺著堪嫂,像睡著了一般。 火紅的嫁衣襯著肌膚如雪木柬。 梳的紋絲不亂的頭發(fā)上皆串,一...
    開封第一講書人閱讀 51,578評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音眉枕,去河邊找鬼恶复。 笑死,一個(gè)胖子當(dāng)著我的面吹牛速挑,可吹牛的內(nèi)容都是我干的谤牡。 我是一名探鬼主播,決...
    沈念sama閱讀 40,320評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼姥宝,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼翅萤!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起腊满,我...
    開封第一講書人閱讀 39,241評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤套么,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后碳蛋,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體胚泌,經(jīng)...
    沈念sama閱讀 45,686評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,878評(píng)論 3 336
  • 正文 我和宋清朗相戀三年肃弟,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了玷室。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,992評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡笤受,死狀恐怖穷缤,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情箩兽,我是刑警寧澤绅项,帶...
    沈念sama閱讀 35,715評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站比肄,受9級(jí)特大地震影響快耿,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜芳绩,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,336評(píng)論 3 330
  • 文/蒙蒙 一掀亥、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧妥色,春花似錦搪花、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,912評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至笔呀,卻和暖如春幢踏,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背许师。 一陣腳步聲響...
    開封第一講書人閱讀 33,040評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工房蝉, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人微渠。 一個(gè)月前我還...
    沈念sama閱讀 48,173評(píng)論 3 370
  • 正文 我出身青樓搭幻,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親逞盆。 傳聞我的和親對(duì)象是個(gè)殘疾皇子檀蹋,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,947評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容