如何在未來的大數(shù)據(jù)和機器學(xué)習(xí)領(lǐng)域奴艾,獲得一份不錯的工作?

2018 年内斯,AI 的發(fā)展腳步會加快蕴潦,這一年將是 AI 技術(shù)重生和數(shù)據(jù)科學(xué)得以重新定義的一年。對于雄心勃勃的數(shù)據(jù)科學(xué)家來說俘闯,他們?nèi)绾卧谂c數(shù)據(jù)科學(xué)相關(guān)的工作市場中脫穎而出潭苞?2018 年會有足夠多的數(shù)據(jù)科學(xué)相關(guān)工作嗎?還是說有可能出現(xiàn)萎縮备徐?接下來萄传,讓我們來分析一下數(shù)據(jù)科學(xué)的趨勢,并一探如何在未來的大數(shù)據(jù)和機器學(xué)習(xí) /AI 領(lǐng)域獲得一份不錯的工作蜜猾⌒懔猓”

在這里我還是要推薦下我自己建的大數(shù)據(jù)學(xué)習(xí)交流群:199427210,群里都是學(xué)大數(shù)據(jù)開發(fā)的蹭睡,如果你正在學(xué)習(xí)大數(shù)據(jù) 衍菱,小編歡迎你加入,大家都是軟件開發(fā)黨肩豁,不定期分享干貨(只有大數(shù)據(jù)開發(fā)相關(guān)的)脊串,包括我自己整理的一份2018最新的大數(shù)據(jù)進階資料和高級開發(fā)教程,歡迎進階中和進想深入大數(shù)據(jù)的小伙伴清钥。

1琼锋、你需要牢固掌握概率統(tǒng)計學(xué),并學(xué)習(xí)和掌握一些算法祟昭,比如樸素貝葉斯缕坎、高斯混合模型、隱馬爾可夫模型篡悟、混淆矩陣谜叹、ROC 曲線匾寝、P-Value 等。

不但要理解這些算法荷腊,還要知道它們的工作原理艳悔。你需要牢固掌握梯度下降、凸優(yōu)化女仰、拉各朗日方法論猜年、二次規(guī)劃、偏微分方程董栽、求積法等相關(guān)算法码倦。

如果你想找一份高薪的工作,還需要掌握機器學(xué)習(xí)技術(shù)和算法锭碳,比如 k-NN袁稽、樸素貝葉斯、SVM 和決策森林等擒抛。

2推汽、

現(xiàn)在大部分機器學(xué)習(xí)都需要海量數(shù)據(jù),所以你無法在單臺機器上進行機器學(xué)習(xí)歧沪。所以歹撒,你需要用到集群,需要掌握 Apache Hadoop 和一些云服務(wù)诊胞,如 Rackspace暖夭、Amazon EC2、Google Cloud Platform撵孤、OpenStack 和 Microsoft Azure 等迈着。

你還需要掌握各種 Unix 工具,如 cat邪码、grep裕菠、find、awk闭专、sed奴潘、sort、cut影钉、tr 等画髓。因為機器學(xué)習(xí)基本上都是在 Unix 系統(tǒng)上運行的,所以需要掌握這些工具平委,知道它們的作用以及如何使用它們雀扶。

3、在掌握編程語言和算法的同時肆汹,不要忽略了數(shù)據(jù)可視化的作用愚墓。如果無法讓你自己或別人理解數(shù)據(jù),那么它們就變得毫無意義昂勉。數(shù)據(jù)可視化就是指如何在正確的時間向正確的人展示數(shù)據(jù)浪册,以便讓他們從中獲得價值。主要的數(shù)據(jù)可視化工具包括:Tableau岗照、QlikView村象、Someka Heat Maps、FusionCharts攒至、Sisense厚者、Plotly、Highcharts迫吐、Datawrapper库菲、D3.js、ggplot 等志膀。

4熙宇、要成為數(shù)據(jù)科學(xué)家,不一定非要拿到數(shù)據(jù)科學(xué)方面的學(xué)位溉浙。事實上烫止,你完全不需要這么做,這樣做反而不是個好主意戳稽。如果你能拿到計算機學(xué)位馆蠕、工程學(xué)學(xué)位、經(jīng)濟學(xué)學(xué)位惊奇、數(shù)學(xué)學(xué)位互躬、統(tǒng)計學(xué)學(xué)位、精算師學(xué)位赊时、金融學(xué)學(xué)位或者自然科學(xué)學(xué)位(物理吨铸、化學(xué)或生物)都是可以的。甚至是人文科學(xué)(包括社會科學(xué))也是可以的祖秒。

2018年跳槽指南:如何找到一份人工智能相關(guān)的工作诞吱?

AI前線 ? 7小時前 ? 技能Get

大數(shù)據(jù)把 AI 推向了技術(shù)炒作的舞臺正中央,數(shù)據(jù)科學(xué)和機器學(xué)習(xí)在各行各業(yè)開始嶄露頭角

本文由 【AI前線】原創(chuàng)竭缝,原文鏈接:http://t.cn/RHqaB5p

作者|Tanmoy Ray房维,譯者|薛命燈,編輯|Emily

AI 前線導(dǎo)讀:“2017 年抬纸,大數(shù)據(jù)把 AI 推向了技術(shù)炒作的舞臺正中央咙俩,數(shù)據(jù)科學(xué)和機器學(xué)習(xí)在各行各業(yè)開始嶄露頭角。機器學(xué)習(xí)開始被應(yīng)用于解決數(shù)據(jù)分析問題。機器學(xué)習(xí)阿趁、AI 和預(yù)測分析成為 2017 年的熱門話題膜蛔。我們見證了基于數(shù)據(jù)的價值創(chuàng)新,包括數(shù)據(jù)科學(xué)平臺脖阵、深度學(xué)習(xí)和主要幾個廠商提供的機器學(xué)習(xí)云服務(wù)皂股,還有機器智能、規(guī)范性分析命黔、行為分析和物聯(lián)網(wǎng)呜呐。

2018 年,AI 的發(fā)展腳步會加快悍募,這一年將是 AI 技術(shù)重生和數(shù)據(jù)科學(xué)得以重新定義的一年蘑辑。對于雄心勃勃的數(shù)據(jù)科學(xué)家來說,他們?nèi)绾卧谂c數(shù)據(jù)科學(xué)相關(guān)的工作市場中脫穎而出坠宴?2018 年會有足夠多的數(shù)據(jù)科學(xué)相關(guān)工作嗎洋魂?還是說有可能出現(xiàn)萎縮?接下來啄踊,讓我們來分析一下數(shù)據(jù)科學(xué)的趨勢忧设,并一探如何在未來的大數(shù)據(jù)和機器學(xué)習(xí) /AI 領(lǐng)域獲得一份不錯的工作〉咄ǎ”

增強技術(shù)實力

編程語言和開發(fā)工具

365 Data Science 收集了來自 LinkedIn 的 1001 數(shù)據(jù)科學(xué)家的信息址晕,發(fā)現(xiàn)需求量最大的編程語言為 R 語言、Python 和 SQL顿锰。另外谨垃,還要求具備 MATLAB、Java硼控、Scala 和 C/C++ 方面的知識刘陶。為了能夠脫穎而出,需要熟練掌握 Weka 和 NumPy 這類工具牢撼。

概率統(tǒng)計學(xué)匙隔、應(yīng)用數(shù)學(xué)和機器學(xué)習(xí)算法

你需要牢固掌握概率統(tǒng)計學(xué),并學(xué)習(xí)和掌握一些算法熏版,比如樸素貝葉斯纷责、高斯混合模型、隱馬爾可夫模型撼短、混淆矩陣再膳、ROC 曲線、P-Value 等曲横。

不但要理解這些算法喂柒,還要知道它們的工作原理。你需要牢固掌握梯度下降、凸優(yōu)化灾杰、拉各朗日方法論蚊丐、二次規(guī)劃、偏微分方程吭露、求積法等相關(guān)算法吠撮。

如果你想找一份高薪的工作,還需要掌握機器學(xué)習(xí)技術(shù)和算法讲竿,比如 k-NN、樸素貝葉斯弄屡、SVM 和決策森林等题禀。

分布式計算和 Unix 工具

現(xiàn)在大部分機器學(xué)習(xí)都需要海量數(shù)據(jù),所以你無法在單臺機器上進行機器學(xué)習(xí)膀捷。所以迈嘹,你需要用到集群,需要掌握 Apache Hadoop 和一些云服務(wù)全庸,如 Rackspace秀仲、Amazon EC2、Google Cloud Platform壶笼、OpenStack 和 Microsoft Azure 等神僵。

你還需要掌握各種 Unix 工具,如 cat覆劈、grep保礼、find、awk责语、sed炮障、sort、cut坤候、tr 等胁赢。因為機器學(xué)習(xí)基本上都是在 Unix 系統(tǒng)上運行的,所以需要掌握這些工具白筹,知道它們的作用以及如何使用它們智末。

查詢語言和 NoSQL 數(shù)據(jù)庫

傳統(tǒng)關(guān)系型數(shù)據(jù)庫已經(jīng)老去。除了 Hadoop 之外遍蟋,你還需要掌握 SQL吹害、Hive 和 Pig,以及 NoSQL 數(shù)據(jù)庫虚青,如 MongoDB它呀、Casssandra、HBase。

基于 NoSQL 分布式數(shù)據(jù)庫的基礎(chǔ)設(shè)施已經(jīng)成為大數(shù)據(jù)倉庫的基礎(chǔ)纵穿。原先在一個中心關(guān)系型數(shù)據(jù)庫上需要 20 個小時才能處理完的任務(wù)下隧,在一個大型的 Hadoop 集群上可能只需要 3 分鐘時間。當然谓媒,你也可以使用 MapReduce淆院、Cloudera、Tarn句惯、PaaS土辩、Chef、Flume 和 ABAP 這些工具抢野。

數(shù)據(jù)可視化工具

在掌握編程語言和算法的同時拷淘,不要忽略了數(shù)據(jù)可視化的作用。如果無法讓你自己或別人理解數(shù)據(jù)指孤,那么它們就變得毫無意義启涯。數(shù)據(jù)可視化就是指如何在正確的時間向正確的人展示數(shù)據(jù),以便讓他們從中獲得價值恃轩。主要的數(shù)據(jù)可視化工具包括:Tableau结洼、QlikView、Someka Heat Maps叉跛、FusionCharts松忍、Sisense、Plotly昧互、Highcharts挽铁、Datawrapper、D3.js敞掘、ggplot 等叽掘。

正確選擇教育背景和專業(yè)

要成為數(shù)據(jù)科學(xué)家,不一定非要拿到數(shù)據(jù)科學(xué)方面的學(xué)位玖雁。事實上更扁,你完全不需要這么做,這樣做反而不是個好主意赫冬。如果你能拿到計算機學(xué)位浓镜、工程學(xué)學(xué)位、經(jīng)濟學(xué)學(xué)位劲厌、數(shù)學(xué)學(xué)位膛薛、統(tǒng)計學(xué)學(xué)位、精算師學(xué)位补鼻、金融學(xué)學(xué)位或者自然科學(xué)學(xué)位(物理哄啄、化學(xué)或生物)都是可以的雅任。甚至是人文科學(xué)(包括社會科學(xué))也是可以的。

但或許你會在其他領(lǐng)域得到更好的發(fā)展咨跌,比如經(jīng)濟沪么、應(yīng)用數(shù)學(xué)或工程領(lǐng)域。首先要確定數(shù)據(jù)科學(xué)這條路是不是適合自己锌半。2018 年絕對不會讓那些有志在數(shù)據(jù)科學(xué)領(lǐng)域一展身手的人失望禽车。不過還是那句話,一個具備分析能力的大腦刊殉、熟練的編程技能殉摔、誠摯的熱情和持續(xù)自我提升的毅力將決定你的數(shù)據(jù)科學(xué)家之路會走多遠。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末冗澈,一起剝皮案震驚了整個濱河市钦勘,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌亚亲,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,104評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件腐缤,死亡現(xiàn)場離奇詭異捌归,居然都是意外死亡,警方通過查閱死者的電腦和手機岭粤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評論 3 399
  • 文/潘曉璐 我一進店門惜索,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人剃浇,你說我怎么就攤上這事巾兆。” “怎么了虎囚?”我有些...
    開封第一講書人閱讀 168,697評論 0 360
  • 文/不壞的土叔 我叫張陵角塑,是天一觀的道長。 經(jīng)常有香客問我淘讥,道長圃伶,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,836評論 1 298
  • 正文 為了忘掉前任蒲列,我火速辦了婚禮窒朋,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蝗岖。我一直安慰自己侥猩,他們只是感情好,可當我...
    茶點故事閱讀 68,851評論 6 397
  • 文/花漫 我一把揭開白布抵赢。 她就那樣靜靜地躺著欺劳,像睡著了一般唧取。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上杰标,一...
    開封第一講書人閱讀 52,441評論 1 310
  • 那天兵怯,我揣著相機與錄音,去河邊找鬼腔剂。 笑死媒区,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的掸犬。 我是一名探鬼主播袜漩,決...
    沈念sama閱讀 40,992評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼湾碎!你這毒婦竟也來了宙攻?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,899評論 0 276
  • 序言:老撾萬榮一對情侶失蹤介褥,失蹤者是張志新(化名)和其女友劉穎座掘,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體柔滔,經(jīng)...
    沈念sama閱讀 46,457評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡溢陪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,529評論 3 341
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了睛廊。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片形真。...
    茶點故事閱讀 40,664評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖超全,靈堂內(nèi)的尸體忽然破棺而出咆霜,到底是詐尸還是另有隱情,我是刑警寧澤嘶朱,帶...
    沈念sama閱讀 36,346評論 5 350
  • 正文 年R本政府宣布蛾坯,位于F島的核電站,受9級特大地震影響见咒,放射性物質(zhì)發(fā)生泄漏偿衰。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,025評論 3 334
  • 文/蒙蒙 一改览、第九天 我趴在偏房一處隱蔽的房頂上張望下翎。 院中可真熱鬧,春花似錦宝当、人聲如沸视事。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,511評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽俐东。三九已至跌穗,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間虏辫,已是汗流浹背蚌吸。 一陣腳步聲響...
    開封第一講書人閱讀 33,611評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留砌庄,地道東北人羹唠。 一個月前我還...
    沈念sama閱讀 49,081評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像娄昆,于是被迫代替她去往敵國和親佩微。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,675評論 2 359

推薦閱讀更多精彩內(nèi)容