2018 年内斯,AI 的發(fā)展腳步會加快蕴潦,這一年將是 AI 技術(shù)重生和數(shù)據(jù)科學(xué)得以重新定義的一年。對于雄心勃勃的數(shù)據(jù)科學(xué)家來說俘闯,他們?nèi)绾卧谂c數(shù)據(jù)科學(xué)相關(guān)的工作市場中脫穎而出潭苞?2018 年會有足夠多的數(shù)據(jù)科學(xué)相關(guān)工作嗎?還是說有可能出現(xiàn)萎縮备徐?接下來萄传,讓我們來分析一下數(shù)據(jù)科學(xué)的趨勢,并一探如何在未來的大數(shù)據(jù)和機器學(xué)習(xí) /AI 領(lǐng)域獲得一份不錯的工作蜜猾⌒懔猓”
在這里我還是要推薦下我自己建的大數(shù)據(jù)學(xué)習(xí)交流群:199427210,群里都是學(xué)大數(shù)據(jù)開發(fā)的蹭睡,如果你正在學(xué)習(xí)大數(shù)據(jù) 衍菱,小編歡迎你加入,大家都是軟件開發(fā)黨肩豁,不定期分享干貨(只有大數(shù)據(jù)開發(fā)相關(guān)的)脊串,包括我自己整理的一份2018最新的大數(shù)據(jù)進階資料和高級開發(fā)教程,歡迎進階中和進想深入大數(shù)據(jù)的小伙伴清钥。
1琼锋、你需要牢固掌握概率統(tǒng)計學(xué),并學(xué)習(xí)和掌握一些算法祟昭,比如樸素貝葉斯缕坎、高斯混合模型、隱馬爾可夫模型篡悟、混淆矩陣谜叹、ROC 曲線匾寝、P-Value 等。
不但要理解這些算法荷腊,還要知道它們的工作原理艳悔。你需要牢固掌握梯度下降、凸優(yōu)化女仰、拉各朗日方法論猜年、二次規(guī)劃、偏微分方程董栽、求積法等相關(guān)算法码倦。
如果你想找一份高薪的工作,還需要掌握機器學(xué)習(xí)技術(shù)和算法锭碳,比如 k-NN袁稽、樸素貝葉斯、SVM 和決策森林等擒抛。
2推汽、
現(xiàn)在大部分機器學(xué)習(xí)都需要海量數(shù)據(jù),所以你無法在單臺機器上進行機器學(xué)習(xí)歧沪。所以歹撒,你需要用到集群,需要掌握 Apache Hadoop 和一些云服務(wù)诊胞,如 Rackspace暖夭、Amazon EC2、Google Cloud Platform撵孤、OpenStack 和 Microsoft Azure 等迈着。
你還需要掌握各種 Unix 工具,如 cat邪码、grep裕菠、find、awk闭专、sed奴潘、sort、cut影钉、tr 等画髓。因為機器學(xué)習(xí)基本上都是在 Unix 系統(tǒng)上運行的,所以需要掌握這些工具平委,知道它們的作用以及如何使用它們雀扶。
3、在掌握編程語言和算法的同時肆汹,不要忽略了數(shù)據(jù)可視化的作用愚墓。如果無法讓你自己或別人理解數(shù)據(jù),那么它們就變得毫無意義昂勉。數(shù)據(jù)可視化就是指如何在正確的時間向正確的人展示數(shù)據(jù)浪册,以便讓他們從中獲得價值。主要的數(shù)據(jù)可視化工具包括:Tableau岗照、QlikView村象、Someka Heat Maps、FusionCharts攒至、Sisense厚者、Plotly、Highcharts迫吐、Datawrapper库菲、D3.js、ggplot 等志膀。
4熙宇、要成為數(shù)據(jù)科學(xué)家,不一定非要拿到數(shù)據(jù)科學(xué)方面的學(xué)位溉浙。事實上烫止,你完全不需要這么做,這樣做反而不是個好主意戳稽。如果你能拿到計算機學(xué)位馆蠕、工程學(xué)學(xué)位、經(jīng)濟學(xué)學(xué)位惊奇、數(shù)學(xué)學(xué)位互躬、統(tǒng)計學(xué)學(xué)位、精算師學(xué)位赊时、金融學(xué)學(xué)位或者自然科學(xué)學(xué)位(物理吨铸、化學(xué)或生物)都是可以的。甚至是人文科學(xué)(包括社會科學(xué))也是可以的祖秒。
2018年跳槽指南:如何找到一份人工智能相關(guān)的工作诞吱?
AI前線 ? 7小時前 ? 技能Get
大數(shù)據(jù)把 AI 推向了技術(shù)炒作的舞臺正中央,數(shù)據(jù)科學(xué)和機器學(xué)習(xí)在各行各業(yè)開始嶄露頭角
本文由 【AI前線】原創(chuàng)竭缝,原文鏈接:http://t.cn/RHqaB5p
作者|Tanmoy Ray房维,譯者|薛命燈,編輯|Emily
AI 前線導(dǎo)讀:“2017 年抬纸,大數(shù)據(jù)把 AI 推向了技術(shù)炒作的舞臺正中央咙俩,數(shù)據(jù)科學(xué)和機器學(xué)習(xí)在各行各業(yè)開始嶄露頭角。機器學(xué)習(xí)開始被應(yīng)用于解決數(shù)據(jù)分析問題。機器學(xué)習(xí)阿趁、AI 和預(yù)測分析成為 2017 年的熱門話題膜蛔。我們見證了基于數(shù)據(jù)的價值創(chuàng)新,包括數(shù)據(jù)科學(xué)平臺脖阵、深度學(xué)習(xí)和主要幾個廠商提供的機器學(xué)習(xí)云服務(wù)皂股,還有機器智能、規(guī)范性分析命黔、行為分析和物聯(lián)網(wǎng)呜呐。
2018 年,AI 的發(fā)展腳步會加快悍募,這一年將是 AI 技術(shù)重生和數(shù)據(jù)科學(xué)得以重新定義的一年蘑辑。對于雄心勃勃的數(shù)據(jù)科學(xué)家來說,他們?nèi)绾卧谂c數(shù)據(jù)科學(xué)相關(guān)的工作市場中脫穎而出坠宴?2018 年會有足夠多的數(shù)據(jù)科學(xué)相關(guān)工作嗎洋魂?還是說有可能出現(xiàn)萎縮?接下來啄踊,讓我們來分析一下數(shù)據(jù)科學(xué)的趨勢忧设,并一探如何在未來的大數(shù)據(jù)和機器學(xué)習(xí) /AI 領(lǐng)域獲得一份不錯的工作〉咄ǎ”
增強技術(shù)實力
編程語言和開發(fā)工具
365 Data Science 收集了來自 LinkedIn 的 1001 數(shù)據(jù)科學(xué)家的信息址晕,發(fā)現(xiàn)需求量最大的編程語言為 R 語言、Python 和 SQL顿锰。另外谨垃,還要求具備 MATLAB、Java硼控、Scala 和 C/C++ 方面的知識刘陶。為了能夠脫穎而出,需要熟練掌握 Weka 和 NumPy 這類工具牢撼。
概率統(tǒng)計學(xué)匙隔、應(yīng)用數(shù)學(xué)和機器學(xué)習(xí)算法
你需要牢固掌握概率統(tǒng)計學(xué),并學(xué)習(xí)和掌握一些算法熏版,比如樸素貝葉斯纷责、高斯混合模型、隱馬爾可夫模型撼短、混淆矩陣再膳、ROC 曲線、P-Value 等曲横。
不但要理解這些算法喂柒,還要知道它們的工作原理。你需要牢固掌握梯度下降、凸優(yōu)化灾杰、拉各朗日方法論蚊丐、二次規(guī)劃、偏微分方程吭露、求積法等相關(guān)算法吠撮。
如果你想找一份高薪的工作,還需要掌握機器學(xué)習(xí)技術(shù)和算法讲竿,比如 k-NN、樸素貝葉斯弄屡、SVM 和決策森林等题禀。
分布式計算和 Unix 工具
現(xiàn)在大部分機器學(xué)習(xí)都需要海量數(shù)據(jù),所以你無法在單臺機器上進行機器學(xué)習(xí)膀捷。所以迈嘹,你需要用到集群,需要掌握 Apache Hadoop 和一些云服務(wù)全庸,如 Rackspace秀仲、Amazon EC2、Google Cloud Platform壶笼、OpenStack 和 Microsoft Azure 等神僵。
你還需要掌握各種 Unix 工具,如 cat覆劈、grep保礼、find、awk责语、sed炮障、sort、cut坤候、tr 等胁赢。因為機器學(xué)習(xí)基本上都是在 Unix 系統(tǒng)上運行的,所以需要掌握這些工具白筹,知道它們的作用以及如何使用它們智末。
查詢語言和 NoSQL 數(shù)據(jù)庫
傳統(tǒng)關(guān)系型數(shù)據(jù)庫已經(jīng)老去。除了 Hadoop 之外遍蟋,你還需要掌握 SQL吹害、Hive 和 Pig,以及 NoSQL 數(shù)據(jù)庫虚青,如 MongoDB它呀、Casssandra、HBase。
基于 NoSQL 分布式數(shù)據(jù)庫的基礎(chǔ)設(shè)施已經(jīng)成為大數(shù)據(jù)倉庫的基礎(chǔ)纵穿。原先在一個中心關(guān)系型數(shù)據(jù)庫上需要 20 個小時才能處理完的任務(wù)下隧,在一個大型的 Hadoop 集群上可能只需要 3 分鐘時間。當然谓媒,你也可以使用 MapReduce淆院、Cloudera、Tarn句惯、PaaS土辩、Chef、Flume 和 ABAP 這些工具抢野。
數(shù)據(jù)可視化工具
在掌握編程語言和算法的同時拷淘,不要忽略了數(shù)據(jù)可視化的作用。如果無法讓你自己或別人理解數(shù)據(jù)指孤,那么它們就變得毫無意義启涯。數(shù)據(jù)可視化就是指如何在正確的時間向正確的人展示數(shù)據(jù),以便讓他們從中獲得價值恃轩。主要的數(shù)據(jù)可視化工具包括:Tableau结洼、QlikView、Someka Heat Maps叉跛、FusionCharts松忍、Sisense、Plotly昧互、Highcharts挽铁、Datawrapper、D3.js敞掘、ggplot 等叽掘。
正確選擇教育背景和專業(yè)
要成為數(shù)據(jù)科學(xué)家,不一定非要拿到數(shù)據(jù)科學(xué)方面的學(xué)位玖雁。事實上更扁,你完全不需要這么做,這樣做反而不是個好主意赫冬。如果你能拿到計算機學(xué)位浓镜、工程學(xué)學(xué)位、經(jīng)濟學(xué)學(xué)位劲厌、數(shù)學(xué)學(xué)位膛薛、統(tǒng)計學(xué)學(xué)位、精算師學(xué)位补鼻、金融學(xué)學(xué)位或者自然科學(xué)學(xué)位(物理哄啄、化學(xué)或生物)都是可以的雅任。甚至是人文科學(xué)(包括社會科學(xué))也是可以的。
但或許你會在其他領(lǐng)域得到更好的發(fā)展咨跌,比如經(jīng)濟沪么、應(yīng)用數(shù)學(xué)或工程領(lǐng)域。首先要確定數(shù)據(jù)科學(xué)這條路是不是適合自己锌半。2018 年絕對不會讓那些有志在數(shù)據(jù)科學(xué)領(lǐng)域一展身手的人失望禽车。不過還是那句話,一個具備分析能力的大腦刊殉、熟練的編程技能殉摔、誠摯的熱情和持續(xù)自我提升的毅力將決定你的數(shù)據(jù)科學(xué)家之路會走多遠。