大數(shù)據(jù)的技術(shù)是一個技術(shù)群落招盲,想全部學習短期內(nèi)是不現(xiàn)實的低缩,那么我們怎么樣科學的有邏輯有規(guī)劃的來學習,怎么進行大數(shù)據(jù)的入門學習呢?我們得了解大數(shù)據(jù)行業(yè)里,有哪些崗位咆繁,我們直接從工作崗位的技能需求來倒推我們?nèi)绾螌W習大數(shù)據(jù)讳推,如何有側(cè)重點的來學習。
第一玩般,先看看有哪些崗位银觅,當然大公司會分的比較詳細,中小企企業(yè)相對要求會全面一些
先看看如下這幅圖坏为,圖沒有很詳細匀伏,我再做解答
我們從整個數(shù)據(jù)項目的業(yè)務(wù)流程出發(fā)熙侍,(以上所有崗位都對編程有要求,所以編程基礎(chǔ)是必不可少的)
對大數(shù)據(jù)以及人工智能概念都是模糊不清的芝雪,該按照什么線路去學習惩系,學完往哪方面發(fā)展,想深入了解晤柄,想學習的同學歡迎加入大數(shù)據(jù)學習qq群:458345782芥颈,有大量干貨(零基礎(chǔ)以及進階的經(jīng)典實戰(zhàn))分享給大家爬坑,讓大家了解到目前國內(nèi)最完整的大數(shù)據(jù)高端實戰(zhàn)實用學習流程體系 盾计。從java和linux入手族铆,其后逐步的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相關(guān)知識一一分享哥攘!
第一, 大數(shù)據(jù)工程師,眾所周知箩做,在沒有大數(shù)據(jù)以前安吁,行業(yè)應(yīng)用已經(jīng)非常成熟了鬼店,最早大家只關(guān)注功能的實現(xiàn),接著重視前臺的界面巍棱,前端工程師因此火了一段時間航徙,因為以前數(shù)據(jù)量不大到踏,所以在功能上并不重視,由于移動互聯(lián)網(wǎng)的發(fā)展讹躯,數(shù)據(jù)量非常龐大了潮梯,這個時候單機服務(wù)器不能解決問題耙旦,那么分布式集群就出現(xiàn)了免都,大數(shù)據(jù)工程師的職責就是搭建大數(shù)據(jù)平臺,所以從上圖可以得知险领,大數(shù)據(jù)工程師绢陌,需要有java基礎(chǔ)(行業(yè)應(yīng)用大部分是java語言編寫的),所以叙淌,今后想從事該崗位的机杜,那么學習的路線圖如下
java基礎(chǔ)----linux----hadoop-----hive椒拗、hbase----scala---spark
第二蚀苛, 算法工程師堵未,該崗位零基礎(chǔ)的小伙伴就請止步吧块饺,更適用于數(shù)學專業(yè)的研究生及以上學歷,對數(shù)據(jù)基礎(chǔ)要求比較高淮腾。
第三谷朝, 數(shù)據(jù)挖掘工程師,建議從python入手送朱,畢竟python里面有大量的數(shù)據(jù)科學的包,也有pyspark,直接從spark里面調(diào)數(shù)據(jù)换薄,不用學習Scala語言(spark的編程語言是Scala),學習的路線如下:
python基礎(chǔ)—python web(強化編程基礎(chǔ))--數(shù)學基礎(chǔ)補充(線性代數(shù)冲泥、概率統(tǒng)計凡恍、離散數(shù)學)--python numpy pandas包---機器學習算法---深度學習
第四, 數(shù)據(jù)分析師闽巩,該崗位對數(shù)學基礎(chǔ)要求不高涎跨,但對綜合素質(zhì)要求非常高六敬,能充分的理解行業(yè)行情外构、公司運營审编、產(chǎn)品運作撼班、對市場敏銳度較高。具備一定的編程基礎(chǔ)垒酬,建議學習python砰嘁,能熟練使用相關(guān)的工具,如excel勘究,sas矮湘、spss等,能寫漂亮的文章做PPT就行口糕,數(shù)學基礎(chǔ)不好的女生可以建議走該方向超棺。
學習路線:python基礎(chǔ)—python numpy pandas包---excel—spss---sas
第五适肠, 大數(shù)據(jù)可視化,該崗位需要前端的相關(guān)基礎(chǔ),大數(shù)據(jù)運維工程師各谚,也不多做介紹了