大數(shù)據(jù)分析師學(xué)習(xí)路線

在美國,大數(shù)據(jù)工程師平均年薪達17.5萬美元摧茴,在中國頂尖的互聯(lián)網(wǎng)公司里绵载,大數(shù)據(jù)工程師的薪酬比同級別的其他職位高出30%以上。DT時代來得太突然了蓬蝶,國內(nèi)發(fā)展勢頭很猛尘分,而大數(shù)據(jù)相關(guān)的人才卻非常地有限,在未來若干年內(nèi)都會是供不應(yīng)求的狀況丸氛,因此程序員們培愁,你們的春天到了!

轉(zhuǎn)行也并非一朝一夕的事情缓窜,你需要對這個行業(yè)有一定的了解定续,并匹配一下自己的知識和能力結(jié)構(gòu)。

以下是一位在BAT大數(shù)據(jù)領(lǐng)域打滾了N年后的分析師寫下的一些總結(jié)和體會給想入行或是剛?cè)胄写髷?shù)據(jù)的朋友借鑒學(xué)習(xí)禾锤!

成為數(shù)據(jù)分析師有哪些要求私股?

1、理論知識要寬泛恩掷,涉及數(shù)學(xué)倡鲸、市場和技術(shù)。要求及對數(shù)據(jù)敏感黄娘,包括統(tǒng)計知識峭状、市場研究克滴、模型原理等。

2优床、常規(guī)分析工具的使用劝赔,包括數(shù)據(jù)庫、數(shù)據(jù)挖掘胆敞、統(tǒng)計分析工具着帽,常用辦公軟件(Excel、PPT移层、思維導(dǎo)圖)等等仍翰。

3、有一定的業(yè)務(wù)理解能力幽钢,能理解業(yè)務(wù)背后的商業(yè)邏輯歉备。因為只有理解了商業(yè)問題,才能轉(zhuǎn)換成數(shù)據(jù)分析的問題匪燕,從而滿足部門的要求蕾羊。

4、數(shù)據(jù)報告和數(shù)據(jù)可視化的能力帽驯。數(shù)據(jù)分析得再好龟再,如果不能以漂亮的方式“表達”,成效也會大打折扣尼变。

現(xiàn)在大多工作都需要你擁有邏輯分析能力利凑,尤其是對數(shù)據(jù)的分析理解。在數(shù)據(jù)化運營理念深入的今天嫌术,BAT這樣的大型互聯(lián)網(wǎng)公司強調(diào)全員參與數(shù)據(jù)化運營哀澈,把數(shù)據(jù)分析當(dāng)作一種能力在培訓(xùn),也必定是未來趨勢度气。

數(shù)據(jù)分析師所需具備的能力和知識(從數(shù)據(jù)分析的4個步驟來理解)

數(shù)據(jù)分析的四個步驟:數(shù)據(jù)獲取割按、數(shù)據(jù)處理、數(shù)據(jù)分析磷籍、數(shù)據(jù)呈現(xiàn)适荣。

1、數(shù)據(jù)獲取

數(shù)據(jù)獲取看似簡單院领,但是需要把握對問題的商業(yè)理解弛矛,轉(zhuǎn)化成數(shù)據(jù)問題來解決,直白點講就是需要哪些數(shù)據(jù)比然,從哪些角度來分析丈氓,界定問題后,再進行數(shù)據(jù)采集。此環(huán)節(jié)万俗,需要數(shù)據(jù)分析師具備結(jié)構(gòu)化的邏輯思維鱼鼓。

推薦書籍:《金字塔原理》、麥肯錫三部曲:麥肯錫意識该编、工具、方法硕淑;

推薦工具:思維導(dǎo)圖工具(Xmind\百度腦圖等)课竣;

2、數(shù)據(jù)處理

數(shù)據(jù)的處理需要掌握有效率的工具:

Excel及高端技能:日常工作通用置媳,容易掌握于樟,處理10萬級別的數(shù)據(jù)很輕松。

學(xué)習(xí)高端Excel需要哪些技能拇囊?

學(xué)習(xí)excel是個循序漸進的過程

基礎(chǔ):簡單的表格數(shù)據(jù)處理迂曲、打印、查詢寥袭、篩選路捧、排序

函數(shù)和公式:常用函數(shù)传黄、高級數(shù)據(jù)計算膘掰、數(shù)組公式、多維引用凡伊、function

可視化圖表:圖形圖示展示窒舟、高級圖表辜纲、圖表插件

數(shù)據(jù)透視表耕腾、VBA程序開發(fā)

按照我習(xí)慣的方法,先過一遍基礎(chǔ)苍苞,知道什么是什么,然后找?guī)讉€case練習(xí)骂际。多逛逛excelhome論壇歉铝,平常多思考如何用excel來解決問題凑耻,善用插件,還有記得保存香浩。

帆軟FineReport:專業(yè)的報表工具,日常做報表設(shè)計一個模板可通用餐弱,只要會寫SQL就可上手囱晴。相比excel做報表,開發(fā)的技術(shù)要求較少降允,能很快地開發(fā)常規(guī)報表艺糜、動態(tài)報表破停,并可以放在移動端和大屏查看真慢。

Oracle和SQL sever:企業(yè)最常用的千萬級別的數(shù)據(jù)庫,熟練掌握SQL語言管嬉。

保持不斷的技術(shù)學(xué)習(xí)蚯撩,比如學(xué)習(xí)新流行的hadoop之類的分布式數(shù)據(jù)庫來提升個人能力胎挎,對求職有幫助。

3德迹、分析數(shù)據(jù)

分析數(shù)據(jù)往往需要各類統(tǒng)計分析模型揭芍,如關(guān)聯(lián)規(guī)則、聚類称杨、分類流酬、預(yù)測模型等等列另。

因此,熟練掌握一些統(tǒng)計分析工具不可免:

SPSS系列:老牌的統(tǒng)計分析軟件,SPSS Statistics(偏統(tǒng)計功能阴绢、市場研究)店乐、SPSS Modeler(偏數(shù)據(jù)挖掘)呻袭,不用編程,易學(xué)左电。

SAS:經(jīng)典挖掘軟件廉侧,需要編程篓足。

R:開源軟件,新流行栈拖,對非結(jié)構(gòu)化數(shù)據(jù)處理效率上更高,需編程涩哟。

各類BI工具:

Tableau:可視化工具的鼻祖,對于處理好的數(shù)據(jù)可作自由的可視化分析潜腻,圖表效果驚人

大數(shù)據(jù)BI工具FineBI:類同Tableau锻弓,可在前端做任意維度分析暴心;數(shù)據(jù)可在前端繼續(xù)處理(計算妓盲、篩選過濾等),可對接hadoop之類的大數(shù)據(jù)平臺檀夹,數(shù)據(jù)處理性能較好筋粗。

推薦書籍:

1、《說菜鳥不會數(shù)據(jù)分析》系列炸渡,入門級書娜亿,初學(xué)者最適。

2蚌堵、《數(shù)據(jù)挖掘與數(shù)據(jù)化運營實戰(zhàn)买决,思路、方法吼畏、技巧與應(yīng)用》督赤,內(nèi)容很系統(tǒng)很全面。

3躲舌、《市場研究定量分析方法與應(yīng)用》,簡明等編著没卸,中國人民大學(xué)出版社。

4办悟、數(shù)據(jù)可視化呈現(xiàn)

很多數(shù)據(jù)分析工具已經(jīng)涵蓋了數(shù)據(jù)可視化部分,只需要把數(shù)據(jù)結(jié)果進行有效的呈現(xiàn)和演講匯報病蛉,可用word\PPT\H5等方式展現(xiàn)瑰煎。

學(xué)習(xí)路線規(guī)劃

高清完整圖文末獲取

第一階段(基礎(chǔ)階段)

Linux學(xué)習(xí)

Linux操作系統(tǒng)介紹與安裝铺然、Linux常用命令魄健、Linux常用軟件安裝、Linux網(wǎng)絡(luò)沽瘦、 防火墻革骨、Shell編程等析恋。

Java 高級學(xué)習(xí)(《深入理解Java虛擬機》、《Java高并發(fā)實戰(zhàn)》)

掌握多線程助隧、掌握并發(fā)包下的隊列、掌握JVM技術(shù)并村、掌握反射和動態(tài)代理、了解JMS哩牍。

Zookeeper學(xué)習(xí)

Zookeeper分布式協(xié)調(diào)服務(wù)介紹、Zookeeper集群的安裝部署瓦盛、Zookeeper數(shù)據(jù)結(jié)構(gòu)、命令。

第二階段(攻堅階段)

Hadoop挠唆、Hive处窥、HBase滔驾、Scala、Spark哆致、Python

第三階段(輔助工具工學(xué)習(xí)階段)

Sqoop、Flume摊阀、Oozie、Hue這些工具的學(xué)習(xí)主要在CSDN胞此,51CTO以及官網(wǎng)都可以學(xué)習(xí)。

那如何學(xué)習(xí)才能快速入門并精通呢漱牵?

學(xué)習(xí)Hadoop生態(tài)(MR、Hbase酣胀、Spark刁赦、Storm等)開發(fā)技術(shù)甚脉,深度講解了數(shù)據(jù)挖掘、機器學(xué)習(xí)相關(guān)的算法宦焦、神經(jīng)網(wǎng)絡(luò)等內(nèi)容!

而且還把集群需要用到的各種程序進行了打包波闹,根據(jù)基礎(chǔ)視頻可以讓你輕松搭建Hadoop完全分布式環(huán)境,像在企業(yè)生產(chǎn)環(huán)境一樣進行學(xué)習(xí)和實踐精堕。

再次強調(diào):

1、把數(shù)據(jù)分析作為一種能力培養(yǎng)歹篓,讓自己在現(xiàn)在的團隊中展現(xiàn)出良好的數(shù)據(jù)分析能力,為你以后內(nèi)部轉(zhuǎn)崗做好準(zhǔn)備庄撮。

2毙籽、扎實學(xué)好一、兩門數(shù)據(jù)挖掘軟件坑赡,基于你已有得編程基礎(chǔ),可以學(xué)SAS或者R毅否,基本能夠滿足很大部分企業(yè)的需求。

3螟加、多看多想多觀察,學(xué)習(xí)業(yè)務(wù)職能是這樣捆探,細水長流,還需要不斷工作積累和廣泛的閱讀徐许。

最后,希望你能夠成為你想成為的人雌隅!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末缸沃,一起剝皮案震驚了整個濱河市修械,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌肯污,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,692評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件哄芜,死亡現(xiàn)場離奇詭異,居然都是意外死亡认臊,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,482評論 3 392
  • 文/潘曉璐 我一進店門失晴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來拘央,“玉大人,你說我怎么就攤上這事灰伟。” “怎么了袱箱?”我有些...
    開封第一講書人閱讀 162,995評論 0 353
  • 文/不壞的土叔 我叫張陵义矛,是天一觀的道長。 經(jīng)常有香客問我凉翻,道長,這世上最難降的妖魔是什么制轰? 我笑而不...
    開封第一講書人閱讀 58,223評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮垃杖,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘调俘。我一直安慰自己旺垒,他們只是感情好肤无,可當(dāng)我...
    茶點故事閱讀 67,245評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著竞漾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪窥翩。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,208評論 1 299
  • 那天叨襟,我揣著相機與錄音,去河邊找鬼糊闽。 笑死,一個胖子當(dāng)著我的面吹牛右犹,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播念链,決...
    沈念sama閱讀 40,091評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼掂墓!你這毒婦竟也來了看成?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,929評論 0 274
  • 序言:老撾萬榮一對情侶失蹤川慌,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后梦重,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,346評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡降瞳,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,570評論 2 333
  • 正文 我和宋清朗相戀三年蚓胸,在試婚紗的時候發(fā)現(xiàn)自己被綠了斗塘。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,739評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡馍盟,死狀恐怖茧吊,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情搓侄,我是刑警寧澤,帶...
    沈念sama閱讀 35,437評論 5 344
  • 正文 年R本政府宣布讶踪,位于F島的核電站,受9級特大地震影響乳讥,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜云石,卻給世界環(huán)境...
    茶點故事閱讀 41,037評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望汹忠。 院中可真熱鬧,春花似錦宽菜、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,677評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽犬庇。三九已至僧界,卻和暖如春侨嘀,著一層夾襖步出監(jiān)牢的瞬間捂襟,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,833評論 1 269
  • 我被黑心中介騙來泰國打工葬荷, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留纽帖,地道東北人。 一個月前我還...
    沈念sama閱讀 47,760評論 2 369
  • 正文 我出身青樓懊直,卻偏偏與公主長得像,于是被迫代替她去往敵國和親室囊。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,647評論 2 354

推薦閱讀更多精彩內(nèi)容