基于hadoop生態(tài)圈的數(shù)據(jù)倉(cāng)庫(kù)實(shí)踐 —— OLAP與數(shù)據(jù)可視化(五) - wzy0623的專欄 - 博客頻道 - CSDN.NET
http://blog.csdn.net/wzy0623/article/details/52370045
當(dāng)前的Zeppelin已經(jīng)支持很多翻譯器颅湘,如Zeppelin 0.6.0版本自帶的翻譯器有alluxio艾恼、cassandra、file交播、hbase遭笋、ignite、kylin、md饱苟、phoenix、sh狼渊、tajo箱熬、angular、elasticsearch狈邑、flink城须、hive、jdbc米苹、lens糕伐、psql、spark等18種之多蘸嘶。插件式架構(gòu)允許用戶在Zeppelin中使用自己熟悉的特定程序語(yǔ)言或數(shù)據(jù)處理方式良瞧。例如,通過使用%spark翻譯器亏较,可以在Zeppelin中使用Scala語(yǔ)言代碼莺褒。
在數(shù)據(jù)可視化方面,Zeppelin已經(jīng)包含一些基本的圖表雪情,如柱狀圖遵岩、餅圖、線形圖巡通、散點(diǎn)圖等尘执,任何后端語(yǔ)言的輸出都可以被圖形化表示。
用戶建立的每一個(gè)查詢叫做一個(gè)note宴凉,note的URL在多用戶間共享誊锭,Zeppelin將向所有用戶實(shí)時(shí)廣播note的變化。Zeppelin還提供一個(gè)只顯示查詢結(jié)果的URL弥锄,該頁(yè)不包括任何菜單和按鈕丧靡。用這種方式可以方便地將結(jié)果頁(yè)作為一幀嵌入到自己的web站點(diǎn)中蟆沫。
//5. Hue與Zeppelin比較
Zeppelin只提供了單一的數(shù)據(jù)處理功能,包括前面提到的數(shù)據(jù)攝取温治、數(shù)據(jù)發(fā)現(xiàn)饭庞、數(shù)據(jù)分析、數(shù)據(jù)可視化等都屬于數(shù)據(jù)處理的范疇熬荆。而Hue的功能相對(duì)豐富的多舟山,除了類似的數(shù)據(jù)處理,還有元數(shù)據(jù)管理卤恳、Oozie工作流管理累盗、作業(yè)管理、用戶管理突琳、Sqoop集成等很多管理功能若债。從這點(diǎn)看,Zeppelin只是一個(gè)數(shù)據(jù)處理工具本今,而Hue更像是一個(gè)綜合管理工具拆座。
(3)使用場(chǎng)景Zeppelin適合單一數(shù)據(jù)處理、但后端處理語(yǔ)言繁多的場(chǎng)景冠息,尤其適合Spark。
Hue適合與Hadoop集群的多個(gè)組件交互孕索、如Oozie工作流逛艰、Sqoop等聯(lián)合處理數(shù)據(jù)的場(chǎng)景,尤其適合與Impala協(xié)同工作搞旭。
Spark交互式分析平臺(tái)Apache Zeppelin的安裝 - Jason Ding的專欄 - 博客頻道 - CSDN.NET
http://blog.csdn.net/jasonding1354/article/details/46822391
Zeppelin介紹
Apache Zeppelin提供了web版的類似ipython的notebook散怖,用于做數(shù)據(jù)分析和可視化。背后可以接入不同的數(shù)據(jù)處理引擎肄渗,包括spark, hive, tajo等镇眷,原生支持scala, java, shell, markdown等。它的整體展現(xiàn)和使用形式和Databricks Cloud是一樣的翎嫡,就是來自于當(dāng)時(shí)的demo欠动。
Zeppelin可實(shí)現(xiàn)你所需要的: - 數(shù)據(jù)采集 - 數(shù)據(jù)發(fā)現(xiàn) - 數(shù)據(jù)分析 - 數(shù)據(jù)可視化和協(xié)作
支持多種語(yǔ)言,默認(rèn)是scala(背后是spark shell)惑申,SparkSQL, Markdown 和 Shell具伍。
Zeppelin特性
Apache Spark 集成
Zeppelin 提供了內(nèi)置的 Apache Spark 集成圈驼。你不需要單獨(dú)構(gòu)建一個(gè)模塊人芽、插件或者庫(kù)。 Zeppelin的Spark集成提供了: - 自動(dòng)引入SparkContext 和 SQLContext - 從本地文件系統(tǒng)或maven庫(kù)載入運(yùn)行時(shí)依賴的jar包绩脆。更多關(guān)于依賴載入器 - 可取消job 和 展示job進(jìn)度
數(shù)據(jù)可視化
一些基本的圖表已經(jīng)包含在Zeppelin中萤厅¢夏ǎ可視化并不只限于SparkSQL查詢,后端的任何語(yǔ)言的輸出都可以被識(shí)別并可視化害碾。 Bank
動(dòng)態(tài)表格 Zeppelin 可以在你的筆記本中動(dòng)態(tài)地創(chuàng)建一些輸入格式。
協(xié)作 Notebook 的 URL 可以在協(xié)作者間分享赦拘。 Zeppelin 然后可以實(shí)時(shí)廣播任何變化慌随,就像在 Google docs 中一樣。
發(fā)布 Zeppelin提供了一個(gè)URL用來僅僅展示結(jié)果躺同,那個(gè)頁(yè)面不包括Zeppelin的菜單和按鈕阁猜。這樣,你可以輕易地將其作為一個(gè)iframe集成到你的網(wǎng)站蹋艺。
使用Zeppelin來實(shí)現(xiàn)大數(shù)據(jù)分析的可視化 - 萌新大數(shù)據(jù) - SegmentFault
https://segmentfault.com/a/1190000005673104
--
Hadoop - Zeppelin 使用心得-Hadoop-@大數(shù)據(jù)資訊
http://www.thebigdata.cn/Hadoop/28985.html
Spark大型項(xiàng)目實(shí)戰(zhàn):電商用戶行為分析大數(shù)據(jù)平臺(tái)(高端大數(shù)據(jù)項(xiàng)目實(shí)戰(zhàn)課程)_北風(fēng)網(wǎng)
http://www.ibeifeng.com/goods-582.html