基于MS的數(shù)據(jù)處理及分析
微軟于2010年推出了用于數(shù)據(jù)清洗和整理的工具 - Excel Power Query日月,該工具基本上是SQL的可視化工具晌柬,通過(guò)對(duì)存儲(chǔ)在excel表中的數(shù)據(jù)進(jìn)行模型的搭建來(lái)形成新的查詢表免绿,這種方式相當(dāng)于微軟提供一套可以通過(guò)界面對(duì)數(shù)據(jù)的結(jié)構(gòu)和關(guān)聯(lián)關(guān)系進(jìn)行管理的軟件浸剩。個(gè)人認(rèn)為是將server sql中的一部分移植到了excel上可帽,實(shí)現(xiàn)了難度的降級(jí)娄涩,從而降低使用者門檻,使原本需要數(shù)據(jù)庫(kù)專業(yè)知識(shí)的操作變?yōu)槭髽?biāo)操作,這對(duì)excel繼續(xù)維持市場(chǎng)份額起到核心競(jìng)爭(zhēng)力的作用蓄拣。
微軟將Power Query ,Power View ,Power pivot , Power Map 集成到一起推出了 Power BI 扬虚,他的Desktop版本是免費(fèi)使用的,個(gè)人用于數(shù)據(jù)分析效果很好球恤。
基本的處理思路是通過(guò)Power Query對(duì)數(shù)據(jù)源進(jìn)行整合辜昵,官方說(shuō)法是進(jìn)行建模,通過(guò)對(duì)數(shù)據(jù)進(jìn)行l(wèi)eft join 左連接等操作后咽斧,形成一張可以用于分析的數(shù)據(jù)底盤堪置,包含了全面的信息 ,另外在Query之后的Power Pivot具有相對(duì)于直接使用Excel分析的優(yōu)勢(shì)在于以下幾點(diǎn):
- 可處理超過(guò)100萬(wàn)行數(shù)據(jù)张惹,實(shí)際采用的就是數(shù)據(jù)庫(kù)引擎
- 使用數(shù)據(jù)分析表達(dá)式 ([DAX])表達(dá)式語(yǔ)言編寫高級(jí)公式舀锨,DAX的功能更加全面和豐富,相對(duì)于Excel的函數(shù)而言
- 可以進(jìn)行向下鉆取宛逗,可以與Power View聯(lián)動(dòng)坎匿,相對(duì)于Excel基礎(chǔ)的數(shù)據(jù)透視而言,Pivot更加靈活和智能雷激,可以極大的節(jié)約時(shí)間替蔬。
由Power Query獲取數(shù)據(jù),進(jìn)行初步數(shù)據(jù)清洗和整理侥锦,梳理出基本的數(shù)據(jù)模型和彼此間數(shù)據(jù)格式进栽,再由Power Pivot進(jìn)行數(shù)據(jù)分析,實(shí)際上Pivot是整個(gè)Power Bi的大腦恭垦,地位非常重要快毛。而Pivot實(shí)際上相當(dāng)于傳統(tǒng)的數(shù)據(jù)透視表,根據(jù)所需要分析的字段和屬性進(jìn)行數(shù)據(jù)透視番挺,從而分析出當(dāng)前數(shù)據(jù)提示出現(xiàn)什么問(wèn)題唠帝。