?zeppelin是一個(gè)非常流行的開源數(shù)據(jù)探索分析平臺(tái)绘盟。提供Web筆記編輯,支持?jǐn)?shù)據(jù)驅(qū)動(dòng)诗宣,使用 SQL膘怕、Scala、Python召庞、R 等語(yǔ)言進(jìn)行交互式數(shù)據(jù)分析和協(xié)作文檔岛心。
- 組成
?zeppelin由notebook来破、paragraph、Interpreter等組成忘古,其核心組織概念是notebook徘禁,所有的操作都可以在notebook中完成。zeppelin集成了非常多的數(shù)據(jù)處理和分析相關(guān)的組件髓堪,實(shí)現(xiàn)數(shù)據(jù)探索(Data Ingestion)送朱、 數(shù)據(jù)發(fā)現(xiàn)(Data Discovery)、 數(shù)據(jù)分析(Data Analytics)干旁、數(shù)據(jù)可視化協(xié)作(Data Visualization & Collaboration)驶沼。 - 特性
1)Web數(shù)據(jù)分析
Apache Zeppelin 解釋器允許將多種語(yǔ)言代碼插入到 Zeppelin。 目前 Apache Zeppelin 支持多種解釋器争群,如 Apache Spark回怜、Apache Flink、Python换薄、R玉雾、JDBC、Markdown 和 Shell轻要。
2)豐富的Intecepter
Apache Zeppelin提供豐富的Intecepter复旬,支持自定義Intecepter。集成Apache Spark伦腐、Flink等開源Intecepter組件赢底,提供Spark、Flink等編程運(yùn)行環(huán)境柏蘑。
3)可視化圖表生成及服務(wù)發(fā)布
Zeppelin支持餅狀圖幸冻、柱狀圖、折線圖等可視化圖表顯示咳焚,
能夠自動(dòng)識(shí)別適于圖表顯示的數(shù)據(jù)處理結(jié)果洽损,將數(shù)據(jù)進(jìn)行統(tǒng)計(jì)圖顯示。
支持圖表服務(wù)發(fā)布革半,操作步驟見下圖鏈接碑定。將圖表發(fā)布成Web服務(wù),能夠通過(guò)瀏覽器訪問(wèn)或者利用iframe標(biāo)簽進(jìn)行頁(yè)面集成又官。
image.png
4)定時(shí)任務(wù)
定時(shí)任務(wù)需要配置cron參數(shù)并重啟Zeppelin服務(wù)延刘。在notebook頁(yè)面進(jìn)行cron表達(dá)式配置,定時(shí)任務(wù)實(shí)現(xiàn)步驟見上圖鏈接六敬。
參考:
[1] Apache Zeppelin官網(wǎng)
[2] Zeppelin交互式分析/分析的可視化
[3] 大數(shù)據(jù)分析工程師入門11-Hue&Zeppelin