Druid-前言(OLAP簡(jiǎn)介)-博客-云棲社區(qū)-阿里云 https://yq.aliyun.com/articles/58777
Druid-基本概念-博客-云棲社區(qū)-阿里云 https://yq.aliyun.com/articles/58779?spm=5176.100239.blogcont58778.12.Rg7WZW
Data
druid的數(shù)據(jù)格式和關(guān)系型數(shù)據(jù)庫(kù)數(shù)據(jù)較為類似, 如下:
timestamp publisher advertiser gender country click price
2011-01-01T01:01:35Z bieberfever.com google.com Male USA 0 0.65
2011-01-01T01:03:63Z bieberfever.com google.com Male USA 0 0.62
2011-01-01T01:04:51Z bieberfever.com google.com Male USA 1 0.45
2011-01-01T01:00:00Z ultratrimfast.com google.com Female UK 0 0.87
2011-01-01T02:00:00Z ultratrimfast.com google.com Female UK 0 0.99
2011-01-01T02:00:00Z ultratrimfast.com google.com Female UK 1 1.53
熟悉OLAP的同學(xué)志秃,對(duì)以下這些概念一定不陌生央拖,druid也把數(shù)據(jù)分為以下三個(gè)部分:
Timestamp Column:將時(shí)間單獨(dú)處理日戈,是因?yàn)閐ruid所有的操作都是圍繞時(shí)間軸來(lái)進(jìn)行的氏涩。
Dimension Columns:維度字段腕扶,是數(shù)據(jù)的屬性啥寇, 一般被用來(lái)過(guò)濾數(shù)據(jù)笨篷。上面的例子著瓶,我們有四個(gè)維度, publisher, advertiser, gender, country. 他們每一個(gè)都可以看是數(shù)據(jù)立方體的一個(gè)軸联予,都可以用來(lái)用來(lái)做橫切。
Metric Columns: 度量字段,是用來(lái)做聚合或者相關(guān)計(jì)算的沸久。 上邊的數(shù)據(jù)季眷, click和price是倆個(gè)度量。度量是可以衡量的數(shù)據(jù)卷胯,一般可以有如下的操作子刮,count ,sum等等