Datavines 是一站式開源數(shù)據(jù)可觀測性平臺宴倍,提供元數(shù)據(jù)管理刹碾、數(shù)據(jù)概覽報告辣辫、數(shù)據(jù)質量管理娩贷,數(shù)據(jù)分布查詢横腿、數(shù)據(jù)趨勢洞察等核心能力开缎,致力于幫助用...
Metric 是 Datavines 中一個核心概念棍好,一個 Metric 表示一個數(shù)據(jù)質量檢查規(guī)則仗岸,比如空值檢查和表行數(shù)檢查都是一個規(guī)則。Met...
Datavines是一站式開源數(shù)據(jù)可觀測性平臺借笙,提供元數(shù)據(jù)管理扒怖、數(shù)據(jù)概覽報告、數(shù)據(jù)質量管理业稼,數(shù)據(jù)分布查詢盗痒、數(shù)據(jù)趨勢洞察等核心能力,致力于幫助用戶...
整體架構 Datavines [github][https://github.com/datavane/datavines] 是一個數(shù)據(jù)可觀測性...
數(shù)據(jù)目錄管理 數(shù)據(jù)源管理 查看低散、創(chuàng)建俯邓、編輯、刪除 元數(shù)據(jù)獲取手動執(zhí)行定時執(zhí)行 數(shù)據(jù)源類型管理 創(chuàng)建數(shù)據(jù)源類型時需要添加類型的元數(shù)據(jù)模型定義熔号,模型...
概述 隨著越來越多的數(shù)據(jù)在企業(yè)中被復制和移動,數(shù)據(jù)管道成為了數(shù)據(jù)的高速公路引镊。數(shù)據(jù)管道的有效性和可靠性將愈發(fā)的重要朦蕴。數(shù)據(jù)的可觀測性側重于管理數(shù)據(jù)的...
本文主要通過源碼來了解SparkStreaming程序從任務生成到任務完成整個執(zhí)行流程以及中間伴隨的checkpoint操作 注:下面源碼只貼出...
Cloudera Engineering Blog 翻譯:Offset Management For Apache Kafka With Apa...
前言 這篇文章的目的如下: HashSet是如何保證元素的不重復和無序 HashSet的增刪(改查?)原理 CopyOnWriteArraySe...