最近在學習Tableau鞍历,發(fā)現這是一個強大的BI工具, 只需要簡單的拖拉拽以后就可以生成看上去很高大上的數據圖表劣砍,感覺就一個字:牛逼响疚!
但是我發(fā)現在碰到一些問題的時候伦糯,如果不掌握或者了解它的一內部原理和邏輯的話靠娱,也很容易掉進坑里。所以了解它的內部原理還是很有必要的锌雀。既然要學習它的內部原理迅诬,首選當然是官方文檔,但是全英文的文檔有時候讓人讀得云里霧里闲礼,所以我想把它翻譯一下铐维,既方便想學習這個軟件的同學,也加深我自己的了解锨并。
英語好的同學請自行前往原官網地址:Dimensions and Measures睬棚。
如果你認為有些地方翻譯不對,歡迎指出包警,共同學習底靠!
以下是自己在學習一段時間以后對度量和維度的理解,相對通俗易懂一點壹瘟,特此補充鳄逾。
tableau中的維度和度量,很多人一開始接觸的時候可能會容易混淆殴俱,但是這兩個概念是tableau用于組織數據的基礎,所以清楚的理解它們是很重要的赠幕。
其實這兩個概念很好區(qū)分询筏,維度相對簡單,大家經衬媛牛看到踱讨,度量稍微生僻一點,大家可能會把它讀作(dù liáng)莺治,后來我發(fā)現應該讀作dù liàng帚稠,其中的“量”就是數量的意思,舉個栗子榄审,一個部門中年齡為25歲的人有5個杆麸,那么25其實就是維度昔头,5是度量,5代表在“25歲”這個維度上統(tǒng)計出來的數量揭斧,所以叫度量未蝌。準確地區(qū)分這兩個概念可以讓我們對數據進行劃分時更加清晰快捷茧妒。
當你連接到一個數據源的時候,Tableau將每個字段分配為以下兩種數據角色:Dimensions(維度)或者Measures(度量)纸型。這些分配方式會如何影響我們使用Tableau來分析數據呢?
Dimensions
當你連接到你的數據源的時候除破,Tableau將離散類型的字段(例如:值類型是字符串或者布爾值的字段)分配到Dimensions中琼腔。
當你將Dimensions中的字段點擊或拖拽進入行或者列當中時,Tableau就創(chuàng)建了行或列的標題光坝。
當你從Dimensions中拖出一個字段放入到一個視圖中時盯另,Tableau都會將它默認為是離散型的洲赵,同時為其分配一個藍色的背景。因此芝发,一個區(qū)分 Dimensions 與 Measures的簡單方法就是看他們的背景(雖然這個方法很有可能出錯)俭令。但是日期類型和數字類型的字段既可以是Dimension,也可以是Measure瓢湃。并且所有的measure既可以是離散的赫蛇,也可以是連續(xù)的悟耘。字段的背景顏色如果是藍色,說明它是離散的筏勒,如果是綠色旺嬉,說明它是連續(xù)的。
當你將一個Dimension拖到行或列中時捐顷,你可以將這個字段改為Measure,只需要點擊字段并選擇Measure废赞。然后你就會發(fā)現視圖中出現一根軸而不再是之前的以字段的值為標題的表格叮姑。并且字段的背景會變成綠色:
如果你想把一個Dimension變成連續(xù)的(不將它轉變?yōu)镸easure)戏溺,方法會比較少,能做到的只有日期dimension耕拷,因為只有日期字段既可以是離散的也可以是連續(xù)的托享,但是通常日期是被看做dimension的。數字型的字段也可以赃绊,但是包含字符串的字段就不行羡榴。
Tableau并不會聚合dimensions。如果你想要聚合一個字段的值忠售,這個字段必須是measure迄沫。如果你想要將一個Dimension轉換為Measure羊瘩, Tableau總是會提示你給這個dimension分配一個聚合方式(例如求和,平均值等等)逝她。聚合意味著通過多個值獲得一個結果睬捶,例如計算數值的個數,或者是它們的平均值宁昭,或者是取它們的最小值酗宋。請查看相應的Aggregation頁面來了解不同的類型的聚合方式的含義蜕猫。
在Tableau的查詢中,Dimensions是以SQL中的“Group By”的方式來呈現的隆圆。
Measures
當你連接到某個數據源的時候翔烁,Tableau會將包含數字信息的字段分配到Measure上。
當你拖拽一個Measure字段到行或者列上時侣背,Tableau會創(chuàng)建一根連續(xù)的軸:
任何從Measures上拖到視圖中的字段默認都會是連續(xù)的贩耐,它的背景色也將會是綠色厦取。但是如果你點擊字段并選擇Discrete(離散),這些相應的值就會變成欄目投的標題铡买。
Tableau繼續(xù)聚合字段的值寻狂,因為即使這個字段現在看起來是離散的朋沮,它也是一個Measure樊拓,而Tableau會一直聚合Measure。如果你愿意你也可以將這個字段轉變?yōu)镈imension筋夏。那樣的話Tableau就不會再聚合該字段的值了条篷。關于將Measure轉換為Dimension的內容請參考這里蛤织。
在視圖中通過外觀區(qū)分dimension和measure
如果你再一個表中無法確定某個字段是dimension還是measure,下面是一個簡單的方法:Measure是被聚合過的涨椒,Dimension就沒有蚕冬。
但是也有例外:
1.如果整個視圖都選擇了不進行聚合,那么囤热,所有的字段都不會進行聚合赢乓。關于不整合數據,請參考Disaggregating Data蚓炬。
2.如果你使用的數據源是多維度的躺屁,數據源內部已經將字段聚合過了犀暑,那么Measure是不會顯示這個聚合過程的。
更多信息請前往: