數(shù)據(jù)分析工具比較:Excel、R浙炼、Python和BI工具

數(shù)據(jù)分析的時代已經(jīng)到來供璧,從國家浩习、政府、企業(yè)到個人聊倔,大數(shù)據(jù)和數(shù)據(jù)分析已經(jīng)成為大家耳熟能詳?shù)拿~晦毙。但是你可能沒有學(xué)過數(shù)據(jù)分析或編程的專業(yè)知識,或者你雖然學(xué)了很多數(shù)據(jù)分析的理論耙蔑,但你還不知道怎樣運用到實踐上见妒。在這里,我將對數(shù)據(jù)分析師最受歡迎的四種工具(Excel甸陌、R须揣、Python和BI)進(jìn)行比較,作為開始學(xué)習(xí)數(shù)據(jù)分析的基礎(chǔ)邀层。

1.Excel

1.1 使用場景

??? 一般辦公室里簡單的數(shù)據(jù)處理工作返敬。

??? 中小型企業(yè)的數(shù)據(jù)管理和存儲遂庄。

??? 學(xué)生或老師用來進(jìn)行簡單的統(tǒng)計分析(如方差分析寥院、回歸分析等)。

??? 結(jié)合 Word和PowerPoint來創(chuàng)建數(shù)據(jù)分析報告涛目。

??? 數(shù)據(jù)分析師的輔助工具秸谢。

??? 為一些商業(yè)雜志和報紙制作圖表(數(shù)據(jù)可視化)。

1.2 優(yōu)勢

??? 入門使用Excel很容易霹肝。

??? 學(xué)習(xí)資源非常豐富估蹄。

??? 你可以用Excel做很多事情:建模、可視化沫换、數(shù)據(jù)報告臭蚁、動態(tài)圖表等。

??? 它可以幫助您在進(jìn)一步學(xué)習(xí)其他工具(如Python和R)之前了解許多操作的含義讯赏。

1.3 缺點

??? 要完全掌握Excel垮兑,需要學(xué)習(xí)VBA,所以難度還是很高的漱挎。

??? 當(dāng)數(shù)據(jù)量很大時系枪,就會出現(xiàn)卡頓的情況。

??? 不借助其他工具的話磕谅,Excel數(shù)據(jù)文件本身只能容納108萬行私爷,不適合處理大規(guī)模數(shù)據(jù)集。

??? 內(nèi)置的統(tǒng)計分析過于簡單膊夹,做高級分析比較吃力衬浑。

??? 與Python、R和其他開源軟件不同放刨,正版Excel需要收費工秩。

2.R

2.1 使用場景

R的功能幾乎涵蓋數(shù)據(jù)分析的所有領(lǐng)域,就我們一般的數(shù)據(jù)分析工作而言,R能做的事情主要有以下幾個方面拓诸。

??? 數(shù)據(jù)清洗侵佃。

??? 網(wǎng)絡(luò)爬取。

??? 數(shù)據(jù)可視化奠支。

??? 統(tǒng)計假設(shè)檢驗(t檢驗馋辈、方差分析、卡方檢驗等)倍谜。

??? 數(shù)據(jù)建模(線性回歸迈螟、邏輯回歸、樹模型尔崔、神經(jīng)網(wǎng)絡(luò)等)答毫。

??? 數(shù)據(jù)分析報告輸出(R markdown)。

2.2 R容易學(xué)嗎季春?

在我看來洗搂,學(xué)習(xí)使用R是比較簡單的,如果經(jīng)過10天的集中學(xué)習(xí)载弄,足以掌握其基本使用耘拇、基本數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)導(dǎo)入導(dǎo)出宇攻、簡單的數(shù)據(jù)可視化等內(nèi)容惫叛。有了這些基礎(chǔ),當(dāng)你遇到實際問題時逞刷,就可以找到你需要使用的R包嘉涌,通過閱讀幫助文件或者網(wǎng)絡(luò)上的資料,可以快速地解決具體的問題夸浅。

?

3. Python

3.1 使用場景

??? 數(shù)據(jù)爬取仑最。

??? 數(shù)據(jù)清洗。

??? 數(shù)據(jù)建模题篷。

??? 根據(jù)業(yè)務(wù)場景和實際問題構(gòu)建數(shù)據(jù)分析算法词身。

??? 數(shù)據(jù)可視化。

??? 數(shù)據(jù)挖掘和分析的高級領(lǐng)域番枚,例如機器學(xué)習(xí)和文本挖掘法严。

3.2 R與Python

R和Python都是可以編程的數(shù)據(jù)分析工具,不同的是葫笼,R專門用于數(shù)據(jù)分析領(lǐng)域深啤,而數(shù)據(jù)分析只是Python 的一個應(yīng)用分支,Python還可以用來開發(fā)網(wǎng)頁路星、開發(fā)游戲或者開發(fā)系統(tǒng)后端溯街,做一些運維的工作诱桂。

?

當(dāng)前的一個趨勢是,在數(shù)據(jù)分析的領(lǐng)域里呈昔,Python正在追趕著R挥等,在某些方面,它已經(jīng)超越了R堤尾,例如機器學(xué)習(xí)和文本挖掘肝劲,但是R在統(tǒng)計領(lǐng)域仍然保持著優(yōu)勢。Python在數(shù)據(jù)分析方面的發(fā)展郭宝,在很多地方都模仿了R的一些特性辞槐,所以,如果你還是新手粘室,還沒有開始學(xué)習(xí)榄檬,我建議你從Python開始。

?

Python和R都很容易入門衔统,但是如果你同時學(xué)習(xí)兩者鹿榜,就會很混亂,因為它們在很多地方都非常相似缰冤。所以建議不要同時學(xué)習(xí)犬缨,等到你掌握了其中一個,然后開始學(xué)習(xí)另一個棉浸。

?

3.3 選擇R還是Python?

如果因為時間有限只能選擇其中之一的去學(xué)習(xí)刺彩,我推薦使用Python迷郑。但我仍然建議你兩者都學(xué)一下,你可能在某些地方聽說Python在工作中更常用创倔,但解決問題才是最重要的嗡害,如果你能用R高效地解決問題,那就用 R畦攘。事實上霸妹,Python模仿了R的許多特性,比如Pandas 庫中的DataFrames知押,還有正在開發(fā)的可視化包ggplot模仿了R中非常有名的ggplot2叹螟。

?

4. 商業(yè)智能(BI)

數(shù)據(jù)分析中有一句話:文字不如表,表不如圖台盯,數(shù)據(jù)可視化是數(shù)據(jù)分析的主要方向之一罢绽。Excel的圖表可以滿足基本的圖形要求,但這只是基礎(chǔ)静盅,高級可視化需要編程的知識良价。除了學(xué)習(xí)R、Python等編程語言外,還可以選擇簡單易用的BI工具明垢。

?

BI的優(yōu)勢在于它更擅長做交互式的報告蚣常,它擅長解釋歷史數(shù)據(jù)和實時數(shù)據(jù),可以大大解放數(shù)據(jù)分析師的工作痊银,提升整個公司的數(shù)據(jù)意識史隆,提高數(shù)據(jù)導(dǎo)入效率。市場上有很多BI產(chǎn)品曼验,例如Powerbi泌射,Smartbi智分析都是非常免費實用的BI工具,它們的原理都是搭建儀表盤鬓照,通過維度的聯(lián)動和鉆取熔酷,得到可視化的分析。


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末豺裆,一起剝皮案震驚了整個濱河市拒秘,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌臭猜,老刑警劉巖躺酒,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異蔑歌,居然都是意外死亡羹应,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進(jìn)店門次屠,熙熙樓的掌柜王于貴愁眉苦臉地迎上來园匹,“玉大人,你說我怎么就攤上這事劫灶÷阄ィ” “怎么了?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵本昏,是天一觀的道長供汛。 經(jīng)常有香客問我,道長涌穆,這世上最難降的妖魔是什么怔昨? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮蒲犬,結(jié)果婚禮上朱监,老公的妹妹穿的比我還像新娘。我一直安慰自己原叮,他們只是感情好赫编,可當(dāng)我...
    茶點故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布巡蘸。 她就那樣靜靜地躺著,像睡著了一般擂送。 火紅的嫁衣襯著肌膚如雪悦荒。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天嘹吨,我揣著相機與錄音搬味,去河邊找鬼。 笑死蟀拷,一個胖子當(dāng)著我的面吹牛碰纬,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播问芬,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼悦析,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了此衅?” 一聲冷哼從身側(cè)響起强戴,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎挡鞍,沒想到半個月后骑歹,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡墨微,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年道媚,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片欢嘿。...
    茶點故事閱讀 39,688評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡衰琐,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出炼蹦,到底是詐尸還是另有隱情,我是刑警寧澤狸剃,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布掐隐,位于F島的核電站,受9級特大地震影響钞馁,放射性物質(zhì)發(fā)生泄漏虑省。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一僧凰、第九天 我趴在偏房一處隱蔽的房頂上張望探颈。 院中可真熱鬧,春花似錦训措、人聲如沸伪节。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽怀大。三九已至纱兑,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間化借,已是汗流浹背潜慎。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留蓖康,地道東北人铐炫。 一個月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像蒜焊,于是被迫代替她去往敵國和親倒信。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,573評論 2 353

推薦閱讀更多精彩內(nèi)容