一站式數(shù)據(jù)可觀測(cè)性平臺(tái) Datavines 正式開源啦

Datavines是一站式開源數(shù)據(jù)可觀測(cè)性平臺(tái)机久,提供元數(shù)據(jù)管理空扎、數(shù)據(jù)概覽報(bào)告藏鹊、數(shù)據(jù)質(zhì)量管理,數(shù)據(jù)分布查詢转锈、數(shù)據(jù)趨勢(shì)洞察等核心能力,致力于幫助用戶全面地了解和掌管數(shù)據(jù)楚殿,讓您做到心中有數(shù)撮慨,目前作為 Datavane 開源組織的重點(diǎn)推薦項(xiàng)目,正式開源脆粥,歡迎大家使用砌溺。

核心特性

數(shù)據(jù)目錄

  • 定時(shí)獲取數(shù)據(jù)源元數(shù)據(jù),構(gòu)造數(shù)據(jù)目錄

  • 定時(shí)監(jiān)聽元數(shù)據(jù)變更情況

  • 支持元數(shù)據(jù)的標(biāo)簽管理

數(shù)據(jù)目錄

數(shù)據(jù)質(zhì)量監(jiān)控

  • 內(nèi)置 27 個(gè)數(shù)據(jù)質(zhì)量檢查規(guī)則变隔,開箱即用

  • 支持 4 種數(shù)據(jù)質(zhì)量檢查規(guī)則類型

    • 單表單列檢查類型

    • 單表自定義SQL檢查類型

    • 跨表準(zhǔn)確性檢查類型

    • 兩表值比對(duì)檢查類型

  • 支持配置定時(shí)任務(wù)進(jìn)行定時(shí)檢查

  • 支持配置 SLA用于檢查結(jié)果告警

數(shù)據(jù)質(zhì)量檢查

數(shù)據(jù)概覽

  • 支持定時(shí)執(zhí)行數(shù)據(jù)探測(cè)规伐,輸出數(shù)據(jù)概覽報(bào)告

  • 支持自動(dòng)識(shí)別列的類型自動(dòng)匹配合適的數(shù)據(jù)概況指標(biāo)

  • 支持表行數(shù)趨勢(shì)監(jiān)控

  • 支持列的數(shù)據(jù)分布情況查看

數(shù)據(jù)概覽

插件化設(shè)計(jì)

平臺(tái)以插件化設(shè)計(jì)為核心,以下模塊都支持用戶自定義插件進(jìn)行擴(kuò)展

  • 數(shù)據(jù)源:已支持 MySQL匣缘、Impala猖闪、Starocks鲜棠、DorisPresto培慌、Trino豁陆、ClickHousePostgreSQL
  • 檢查規(guī)則:內(nèi)置空值檢查吵护、非空檢查盒音、枚舉檢查等27個(gè)檢查規(guī)則
  • 作業(yè)執(zhí)行引擎:已支持SparkLocal兩種執(zhí)行引擎。Spark引擎目前僅支持Spark2.4版本馅而,Local 引擎則是基于JDBC開發(fā)的本地執(zhí)行引擎祥诽,無需依賴其他執(zhí)行引擎。
  • 告警通道:已支持郵件
  • 錯(cuò)誤數(shù)據(jù)存儲(chǔ):已支持 MySQL本地文件(僅支持Local執(zhí)行引擎)
  • 注冊(cè)中心:已支持 MySQL瓮恭、PostgreSQLZooKeeper

多種運(yùn)行模式

  • 提供Web頁面配置檢查作業(yè)原押、運(yùn)行作業(yè)、查看作業(yè)執(zhí)行日志偎血、查看錯(cuò)誤數(shù)據(jù)和檢查結(jié)果

  • 支持在線生成作業(yè)運(yùn)行腳本诸衔,通過 datavines-submit.sh 來提交作業(yè),可與調(diào)度系統(tǒng)配合使用

作業(yè)腳本

容易部署&高可用

  • 平臺(tái)依賴少颇玷,容易部署

  • 最小僅依賴 MySQL 既可啟動(dòng)項(xiàng)目笨农,完成數(shù)據(jù)質(zhì)量作業(yè)的檢查

  • 支持水平擴(kuò)容,自動(dòng)容錯(cuò)

  • 無中心化設(shè)計(jì)帖渠,Server 節(jié)點(diǎn)支持水平擴(kuò)展提高性能

  • 作業(yè)自動(dòng)容錯(cuò)谒亦,保證作業(yè)不丟失和不重復(fù)執(zhí)行

項(xiàng)目架構(gòu)

Datavines架構(gòu)圖

CatalogManager

CatalogManager 是負(fù)責(zé)管理元數(shù)據(jù)的組件,主要負(fù)責(zé)元數(shù)據(jù)的存儲(chǔ)空郊、查詢以及元數(shù)據(jù)獲取任務(wù)的調(diào)度和容錯(cuò)處理等份招。

DataQualityCenter

DataQualityCenter 是負(fù)責(zé)數(shù)據(jù)質(zhì)量管理的組件,主要負(fù)責(zé)數(shù)據(jù)質(zhì)量規(guī)則的管理狞甚、數(shù)據(jù)質(zhì)量作業(yè)的調(diào)度锁摔、執(zhí)行和自動(dòng)容錯(cuò)處理等。

快速上手

數(shù)據(jù)概覽

進(jìn)行數(shù)據(jù)概覽只需下面3步:

  • 創(chuàng)建數(shù)據(jù)源(或者選擇創(chuàng)建好的數(shù)據(jù)源)
  • 點(diǎn)擊相應(yīng)的表
  • 點(diǎn)擊右上角 運(yùn)行概覽 并選擇想要探查的列

數(shù)據(jù)質(zhì)量檢查

進(jìn)行數(shù)據(jù)質(zhì)量檢查只需下面4步:

  • 點(diǎn)擊想要進(jìn)行檢查的列哼审,點(diǎn)擊 添加作業(yè)
  • 選擇 檢查規(guī)則 并填入?yún)?shù)
  • 選擇 檢查公式 谐腰,比如 實(shí)際值/期望值 x100% ,填入比較符和閾值
  • 點(diǎn)擊保存并運(yùn)行即可

加入我們

Datavines 的目標(biāo)是成為更好的數(shù)據(jù)可觀測(cè)性領(lǐng)域的開源項(xiàng)目涩盾,為更多的用戶去解決元數(shù)據(jù)管理和數(shù)據(jù)質(zhì)量管理中遇到的問題十气。在此我們真誠(chéng)歡迎更多的貢獻(xiàn)者參與到社區(qū)建設(shè)中來,和我們一起成長(zhǎng)春霍,攜手共建更好的社區(qū)砸西。

關(guān)于Datavane

Datavane是一個(gè)專注于大數(shù)據(jù)領(lǐng)域的開源組織(社區(qū)),由一群大數(shù)據(jù)領(lǐng)域優(yōu)秀的開源項(xiàng)目作者共同創(chuàng)建,旨在幫助開源項(xiàng)目作者更好的建設(shè)項(xiàng)目芹枷、為大眾提供高質(zhì)量的開源軟件衅疙,宗旨是:只為做一個(gè)好軟件。目前已經(jīng)聚集了一批優(yōu)質(zhì)的開源項(xiàng)目杖狼,涉及到數(shù)據(jù)集成炼蛤、大數(shù)據(jù)組件管理、數(shù)據(jù)質(zhì)量等蝶涩。

Datavane 社區(qū)中理朋,所有的項(xiàng)目都是開源開放的,代碼質(zhì)量和架構(gòu)設(shè)計(jì)優(yōu)質(zhì)的潛力項(xiàng)目绿聘。社區(qū)保持開放中立嗽上、協(xié)作創(chuàng)造、堅(jiān)持精品熄攘,鼓勵(lì)所有的開發(fā)者兽愤、用戶和貢獻(xiàn)者積極參與我們的社區(qū)、共同合作挪圾,創(chuàng)新創(chuàng)造浅萧,建設(shè)一個(gè)更加強(qiáng)大的開源社區(qū)。

Github: https://github.com/datavane

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末哲思,一起剝皮案震驚了整個(gè)濱河市洼畅,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌棚赔,老刑警劉巖帝簇,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異靠益,居然都是意外死亡丧肴,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門胧后,熙熙樓的掌柜王于貴愁眉苦臉地迎上來芋浮,“玉大人,你說我怎么就攤上這事绩卤⊥狙” “怎么了?”我有些...
    開封第一講書人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵濒憋,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我陶夜,道長(zhǎng)凛驮,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任条辟,我火速辦了婚禮黔夭,結(jié)果婚禮上宏胯,老公的妹妹穿的比我還像新娘。我一直安慰自己本姥,他們只是感情好肩袍,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著婚惫,像睡著了一般氛赐。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上先舷,一...
    開封第一講書人閱讀 51,624評(píng)論 1 305
  • 那天艰管,我揣著相機(jī)與錄音,去河邊找鬼蒋川。 笑死牲芋,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的捺球。 我是一名探鬼主播缸浦,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼氮兵!你這毒婦竟也來了裂逐?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤胆剧,失蹤者是張志新(化名)和其女友劉穎絮姆,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體秩霍,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡篙悯,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了铃绒。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鸽照。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖颠悬,靈堂內(nèi)的尸體忽然破棺而出矮燎,到底是詐尸還是另有隱情,我是刑警寧澤赔癌,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布诞外,位于F島的核電站,受9級(jí)特大地震影響灾票,放射性物質(zhì)發(fā)生泄漏峡谊。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望既们。 院中可真熱鬧濒析,春花似錦、人聲如沸啥纸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽斯棒。三九已至盾致,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間名船,已是汗流浹背绰上。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留渠驼,地道東北人蜈块。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像迷扇,于是被迫代替她去往敵國(guó)和親百揭。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容