要成為一名數(shù)據(jù)科學(xué)家斤彼,需要掌握哪些核心技能分瘦?
作為一名數(shù)據(jù)科學(xué)家蘸泻,一般需要編程和數(shù)據(jù)庫(kù)、數(shù)學(xué)&統(tǒng)計(jì)嘲玫、交流和可視化悦施、領(lǐng)導(dǎo)力和軟技能:四個(gè)方面的技能。
1去团、編程和數(shù)據(jù)庫(kù)
一般來(lái)說(shuō)抡诞,數(shù)據(jù)科學(xué)家大多要求具備編程、計(jì)算機(jī)科學(xué)相關(guān)的專(zhuān)業(yè)背景渗勘,掌握對(duì)處理大數(shù)據(jù)所必需的Hadoop沐绒、Mahout等大規(guī)模并行處理技術(shù)與機(jī)器學(xué)習(xí)相關(guān)的技能。一般能利用python熟練的獲取數(shù)據(jù)旺坠,整理數(shù)據(jù)乔遮,并會(huì)使用matplotlib展現(xiàn)數(shù)據(jù)。
2取刃、數(shù)學(xué)蹋肮、統(tǒng)計(jì)和數(shù)據(jù)挖掘
除了數(shù)學(xué)、統(tǒng)計(jì)方面的素養(yǎng)之外璧疗,還需要具備使用SPSS坯辩、SAS等主流統(tǒng)計(jì)分析軟件的技能。其中崩侠,面向統(tǒng)計(jì)分析的開(kāi)源編程語(yǔ)言及其運(yùn)行環(huán)境「R」最近備受矚目漆魔。R的強(qiáng)項(xiàng)不僅在于其包含了豐富的統(tǒng)計(jì)分析庫(kù),而且具備將結(jié)果進(jìn)行可視化的高品質(zhì)圖表生成功能却音,并可以通過(guò)簡(jiǎn)單的命令來(lái)運(yùn)行改抡。此外,它還具備稱(chēng)為CRAN(The Comprehensive R Archive Network)的包擴(kuò)展機(jī)制系瓢,通過(guò)導(dǎo)入擴(kuò)展包就可以使用標(biāo)準(zhǔn)狀態(tài)下所不支持的函數(shù)和數(shù)據(jù)集阿纤。
3、數(shù)據(jù)可視化
信息的質(zhì)量很大程度上依賴(lài)于其表達(dá)方式夷陋。對(duì)數(shù)字羅列所組成的數(shù)據(jù)中所包含的意義進(jìn)行分析欠拾,開(kāi)發(fā)Web原型,使用外部API將圖表骗绕、地圖藐窄、Dashboard等其他服務(wù)統(tǒng)一起來(lái),從而使分析結(jié)果可視化酬土,這是對(duì)于數(shù)據(jù)科學(xué)家來(lái)說(shuō)十分重要的技能之一枷邪。
4、領(lǐng)導(dǎo)力和軟技能
數(shù)據(jù)科學(xué)家不僅要具有黑客的頭腦,對(duì)數(shù)據(jù)有好奇心东揣,還要對(duì)商業(yè)有熱情践惑,是有影響力、有創(chuàng)造力嘶卧,能解決問(wèn)題的人尔觉。