Power BI組成:
Power Query占键、Power Pivot昔善、Power View、Power Map
一畔乙、數(shù)據(jù)處理的3個(gè)過程:數(shù)據(jù)獲取君仆、數(shù)據(jù)整理、數(shù)據(jù)豐富
1.數(shù)據(jù)獲取
2.數(shù)據(jù)整理(數(shù)據(jù)清洗)
a.提升標(biāo)題
b.更改數(shù)據(jù)類型
c.刪除錯(cuò)誤(error)/空值(null)
d.刪除重復(fù)項(xiàng)
e.填充
f.合并列
g.拆分列
h.分組
i.提取
j.行列轉(zhuǎn)置(注意把標(biāo)題降下來)
k.行列操作
l.逆透視列(二維表轉(zhuǎn)一維表牲距,寬表降維)
m.透視列(數(shù)據(jù)透視返咱,增加維度)
3.數(shù)據(jù)豐富
a.添加列:添加重復(fù)列、添加索引列牍鞠、添加條件列咖摹、添加自定義列
b.追加查詢(在下面添加新的行數(shù)據(jù),縱向合并)
c.合并查詢(橫向合并數(shù)據(jù))
二难述、M函數(shù)
1.M 函數(shù)基本規(guī)范
M 函數(shù)對大小寫敏感萤晴,第一個(gè)字母都是大寫
表被稱為 Table,每行的內(nèi)容是一個(gè) Record胁后,每列的內(nèi)容是一個(gè) List
行標(biāo)用大括號{ }店读,比如取第一行的內(nèi)容:=表{0} //PQ 的第一行從 0 開始
列標(biāo)用中括號[ ],比如取自定義列的內(nèi)容:=表[自定義]
取第一行自定義列的內(nèi)容:=表{0}[自定義
2.常用的 M 函數(shù)
? 聚合函數(shù):
求和:List.Sum()
求最小值:List.Min()
求最大值:List.Max()
求平均值:List.Average()
? 文本函數(shù):
求文本長度:Text.Length()
去文本空格:Text.Trim()
取前 n 個(gè)字符:Text.Start(文本,n)
取后 n 個(gè)字符:Text.End(文本,n)
? 提取數(shù)據(jù)函數(shù):
從 Excel 表中提取數(shù)據(jù):Excel.Workbook()
從 Csv/Txt 中提取數(shù)據(jù):Csv.Document()
? 條件函數(shù):
if else then (相當(dāng)于 Excel 中的 IF)
在公式標(biāo)記欄中輸入#shared攀芯,就把所有的 M 函數(shù)顯示出來
三屯断、數(shù)據(jù)建模 度量值&DAX函數(shù)
1.DAX 參數(shù)的基本格式 :
表名用單引號' '括著 // '日期表'
字段用中括號[ ]括著 //[日期]
度量值也是用中括號[ ]
引用字段始終要包含表名,以和度量值區(qū)分開
2. DAX 常用函數(shù)
聚合函數(shù):SUM ,AVERAGE ,MIN ,MAX ,COUNT(計(jì)數(shù)) ,COUNTROWS(計(jì)算行數(shù))裹纳,DISTINCTCOUNT(計(jì)算不重復(fù)值個(gè)數(shù))
(迭代函數(shù):SUMX择葡,AVERAGEX, MINX, MAXX, RANKX)
時(shí)間智能函數(shù):
PREVIOUSYEAR/Q/M/D:上一年/季/月/日
NEXTYEAR/Q/M/D:下一年/季/月/日
TOTALYTD/QTD/MTD:年/季/月初至今
SAMEPERIODLASTYEAR:上年同期
PARALLELPERIOD:上一期
DATESINPERIOD:指定期間的日期
篩選函數(shù)(DAX查詢函數(shù)):
FILTER:篩選
ALL:所有值,可以清除篩選
ALLEXCEPT:保留指定列
VALUES:返回不重復(fù)值
3.CALCULATE的語法結(jié)構(gòu)
語法:CALCULATE(<expression>,<filter1>,<filter2>…)
a.第一個(gè)參數(shù)是計(jì)算表達(dá)式剃氧,可以執(zhí)行各種聚合運(yùn)算
b.第二個(gè)參數(shù)開始敏储,是一系列篩選條件,可以為空朋鞍;如果多個(gè)篩選條件已添,用逗號分隔
c.所有篩選條件的交集形成最終的篩選數(shù)據(jù)集合
d.根據(jù)篩選出的數(shù)據(jù)集合執(zhí)行第一個(gè)參數(shù)的聚合運(yùn)算并返回運(yùn)算結(jié)果
4.FILTER函數(shù)語法結(jié)構(gòu)
FILTER(<table>,<filter>)
a.第一個(gè)參數(shù)<table>是要篩選的表
b.第二個(gè)參數(shù)<filter>是篩選條件
c.函數(shù)返回結(jié)果是一張表,不能單獨(dú)使用滥酥,需要與其他函數(shù)結(jié)合使用
5.HASONEVALUE(<columnName>)
參數(shù)只有:列名 作用:判斷外部上下文中是否為該列中的唯一值更舞,做切片器交互時(shí)比較有用
6.SUMX(<table>,<expression>)
第一個(gè)參數(shù)為被運(yùn)算的表table,第二個(gè)參數(shù)是對表中的每一行計(jì)算的表達(dá)式
7.EARLIER函數(shù)
EARLIER語法(<column>,<number>)
a.第一個(gè)參數(shù)是列名
b.第二個(gè)參數(shù)一般可以省略
c.EARLIER函數(shù)提取本行對應(yīng)的該列的值坎吻,實(shí)際上就是提取本行和參數(shù)行列交叉的單元格
四缆蝉、可視化制作
1.柱形圖
a.堆積柱形圖
不同序列顯示在一根柱子上,可以直接比較總量大小瘦真,分類序列的數(shù)值比較功能弱化
b.簇狀柱形圖
不同序列使用不同的柱子刊头,可以比較各序列的數(shù)值大小,總量比較功能弱化
c.百分比堆積柱形圖
不同序列在一根柱子顯示诸尽,明顯對比各序列的相對大小原杂,Y軸標(biāo)簽變?yōu)榘俜直龋瑹o法比較總量您机,每根柱子一樣高
2.矩形樹狀圖
使用場景:
a. 要顯示大量的分層數(shù)據(jù)( 條形圖不能有效地處理大量值)
b. 要顯示每個(gè)部分與整體之間的比例
c. 要顯示層次結(jié)構(gòu)中指標(biāo)在各個(gè)類別層次的分布的模式
d. 要使用大小和顏色編碼顯示屬性
e. 要發(fā)現(xiàn)模式穿肄、離群值、最重要因素和異常
3.地圖
氣泡地圖 Bubble Map
著色地圖 Filled Map
ArcGIS Map