鏈接散落的教程文章,做個(gè)詳細(xì)的導(dǎo)讀产镐,助你更高效入門數(shù)據(jù)科學(xué)隘庄。
問題
2017年6月以來(lái)踢步,我陸續(xù)在自己的簡(jiǎn)書專欄《玉樹芝蘭》里癣亚,寫了一系列數(shù)據(jù)科學(xué)教程。
這源于一次研究生課編程工作坊嘗試获印。受閻教練的創(chuàng)新思維訓(xùn)練營(yíng)啟發(fā)述雾,我在課后把詞云制作流程詳細(xì)記錄轉(zhuǎn)述,分享給了大家兼丰。
沒想到玻孟,這篇《如何用Python做詞云?》受到了讀者們非常熱烈的歡迎鳍征。
此后黍翎,一發(fā)不可收拾。
應(yīng)讀者的要求艳丛,結(jié)合我自己的學(xué)習(xí)匣掸、科研和教學(xué)實(shí)踐,我陸續(xù)分享了更多與數(shù)據(jù)科學(xué)相關(guān)的文章氮双。
讀者越來(lái)越多碰酝,我收到的問題也愈發(fā)五花八門。
許多讀者的問題戴差,我其實(shí)都已經(jīng)在其他的文章里面講解過了送爸,因此有時(shí)用“請(qǐng)參考我的另一篇文章《……》,鏈接為……”來(lái)答復(fù)暖释,也幫助讀者解決了問題袭厂。
在建構(gòu)同理心(empathy)之前,估計(jì)我會(huì)問出這樣的問題:
他們?yōu)槭裁床环业钠渌恼履兀?/p>
但現(xiàn)在球匕,我能感受到他們的疑惑:
我哪里知道你寫過另一篇文章纹磺?
散落在各處的文章,不容易系統(tǒng)學(xué)習(xí)和檢索谐丢。于是我在2017年11月爽航,把寫過的數(shù)據(jù)科學(xué)系列教程匯集到了一起蚓让,做了個(gè)索引貼。
我把這個(gè)索引貼鏈接置于每篇新教程的末尾讥珍,并不斷更新維護(hù)历极。
然而,這樣簡(jiǎn)單的標(biāo)題索引衷佃,依然無(wú)法滿足許多讀者的需求趟卸。
有的讀者跟著教程做完了詞云,發(fā)現(xiàn)如果對(duì)中文文本做分析氏义,就會(huì)出現(xiàn)亂碼:
這時(shí)候锄列,你該怎么辦呢?
更進(jìn)一步惯悠,如果你希望把詞云的外邊框變成指定的形狀邻邮,又該如何操作?
光看標(biāo)題克婶,你可能不容易發(fā)現(xiàn)哪一篇文章會(huì)幫助自己解決這些問題筒严,甚至可能會(huì)選擇放棄。
我決定做這個(gè)導(dǎo)讀情萤。
這篇文章鸭蛙,不再是從任務(wù)出發(fā),簡(jiǎn)單羅列文章標(biāo)題和鏈接筋岛;而是從先易后難的認(rèn)知習(xí)慣娶视,重新組織文章順序,簡(jiǎn)要介紹內(nèi)容睁宰,提示可能遇到的問題肪获。
希望對(duì)你的學(xué)習(xí)能有幫助。
基礎(chǔ)環(huán)境
大部分的教程勋陪,都是在 Python 運(yùn)行環(huán)境 Jupyter Notebook 下運(yùn)行和演示贪磺。
安裝這個(gè)運(yùn)行環(huán)境,最簡(jiǎn)單的方法诅愚,就是安裝 Anaconda 集成套件寒锚。
請(qǐng)先收看這個(gè)視頻教程《如何安裝Python運(yùn)行環(huán)境Anaconda?(視頻教程)》违孝,自己嘗試安裝Anaconda刹前,運(yùn)行起第一個(gè)Jupyter Notebook,輸出一個(gè)“Hello world!”出來(lái)雌桑。
有了這個(gè)基礎(chǔ)喇喉,你就可以嘗試不同的數(shù)據(jù)科學(xué)任務(wù)了。
我的建議是先做詞云校坑。
因?yàn)楹?jiǎn)單拣技,而且有成就感千诬。
詞云
跟著圖文教程《如何用Python做詞云?》一步步執(zhí)行膏斤。用幾行Python代碼徐绑,你就可以做出這樣的詞云來(lái)。
我還專門把它升級(jí)做成了視頻教程《如何用Python做詞云莫辨?(基礎(chǔ)篇視頻教程)》傲茄,供你觀看。
參看這篇文章《如何用Python做中文分詞沮榜?》盘榨,你就能做出這樣的中文詞云。
如果你希望改變?cè)~云邊框外觀蟆融,就參考這篇文章《Python編程遇問題草巡,文科生怎么辦?》的最后部分振愿。
到這里捷犹,你已掌握Python運(yùn)行環(huán)境安裝弛饭、文本文件讀取冕末、常見軟件包調(diào)用、可視化分析與結(jié)果呈現(xiàn)和中文分詞等基本功夫了侣颂。
回頭望去档桃,是不是成就感爆棚呢?
虛擬環(huán)境
細(xì)心的你憔晒,可能已經(jīng)發(fā)現(xiàn)藻肄,圖文教程和視頻內(nèi)容并不完全一致。
視頻教程目前全系列采用Python 3.6版本拒担,未來(lái)得及重新整理的詞云圖文教程嘹屯,展示的確實(shí)2.7版本Python。
為什么呢从撼?
因?yàn)殡S著技術(shù)的發(fā)展州弟,Python已經(jīng)逐步要過渡到3.X版本了。
許多第三方軟件包都已經(jīng)宣布了時(shí)間表低零,盡快支持3.X婆翔,放棄2.X版本的支持。
才半年掏婶,你就可以感受到技術(shù)啃奴、社群和環(huán)境的變化之快。
可是目前某些軟件包雄妥,依然只能支持2.X版本Python最蕾。雖然這樣的軟件包越來(lái)越少了依溯。
你需要暫時(shí)做個(gè)“兩棲動(dòng)物”,千萬(wàn)不要束縛自己瘟则,因?yàn)椤傲?chǎng)原因”固執(zhí)著不肯用低版本Python誓沸。這樣吃虧的是自己。
怎樣才能做個(gè)“兩棲動(dòng)物”呢壹粟?
辦法之一拜隧,就是使用Anaconda的虛擬環(huán)境〕孟桑可以參考《如何在Jupyter Notebook中使用Python虛擬環(huán)境洪添?》。
你初始安裝版本針對(duì)Python 2.7的Anaconda雀费,并不妨礙你快速建立一個(gè)3.6版本Python的虛擬環(huán)境干奢。
有了這個(gè)秘籍,你就可以在不同版本的Python之間左右逢源盏袄,游刃有余了忿峻。
自然語(yǔ)言處理
下一步,我們來(lái)嘗試自然語(yǔ)言處理(Natural Language Processing, NLP)辕羽。
情感分析逛尚,是NLP在許多社會(huì)科學(xué)領(lǐng)域熱門的應(yīng)用之一。
《如何用Python做情感分析刁愿?》這篇文章绰寞,分別從英文和中文兩個(gè)案例,分別采用不同的軟件包铣口,針對(duì)性地解決應(yīng)用需求滤钱。
你只需要幾行代碼,就能讓Python告訴你情感的取向脑题。是不是很厲害件缸?
有了情感分析做基礎(chǔ),你可以嘗試增加維度叔遂,對(duì)更大體量的數(shù)據(jù)做分析他炊。
增加時(shí)間維度,就可以持續(xù)分析變化的輿情掏熬。
《如何用Python做輿情時(shí)間序列可視化佑稠?》這篇文章,一步步指引你在時(shí)間刻度上可視化情感分析結(jié)果:
這圖難看了一些旗芬。
不過我們需要容忍自己起步時(shí)的笨拙舌胶,不斷迭代與精進(jìn)。
希望一出手就滿分疮丛,對(duì)極少數(shù)天才幔嫂,確實(shí)無(wú)非是日常辆它。
但對(duì)大多數(shù)人,是拖延癥的開始履恩。
你可能迫不及待锰茉,嘗試換自己的數(shù)據(jù)做時(shí)間序列可視化分析。
不過日期數(shù)據(jù)如果與樣例有出入切心,可能會(huì)出現(xiàn)問題飒筑。
這時(shí)候,不要慌绽昏,請(qǐng)參考《Python編程遇問題协屡,文科生怎么辦?》的第二部分全谤,其中有詳細(xì)的錯(cuò)誤原因分析與對(duì)策展示肤晓。
看過后,分析結(jié)果圖也會(huì)迭代成這個(gè)樣子:
到這里认然,你對(duì)情感分析有點(diǎn)兒感覺了吧补憾?
如果你不打算使用第三方提供的情感分類算法,打算自己動(dòng)手訓(xùn)練一個(gè)更為精確的情感分類模型卷员,可以參考《如何用Python和機(jī)器學(xué)習(xí)訓(xùn)練中文文本情感分類模型盈匾?》一文。
剛剛這些情感分析子刮,其實(shí)只是極性分析(正面vs負(fù)面)威酒。但是我們都知道,人的情感其實(shí)是多方面共同構(gòu)成的挺峡。
如何從文本中,分解出多維度的情感特征變化呢担钮?
《如何用Python和R對(duì)《權(quán)力的游戲》故事情節(jié)做情緒分析橱赠?》一文分析了《權(quán)力的游戲》中某一集劇本,你會(huì)獲得這樣的結(jié)果:
如果你是《權(quán)力的游戲》劇迷箫津,請(qǐng)告訴我狭姨,這張圖描繪的是哪一集?
先猜猜看苏遥,然后再打開文章饼拍,跟結(jié)尾做對(duì)比。
這篇文章的可視化分析部分田炭,用的是R师抄。
R也是數(shù)據(jù)科學(xué)領(lǐng)域一個(gè)非常受歡迎的開源工具。它的通用性和熱度可能不如Python(畢竟Python除了數(shù)據(jù)科學(xué)教硫,還能干許多其他的事兒)叨吮,但是因?yàn)橛薪y(tǒng)計(jì)學(xué)界諸多科學(xué)家的擁護(hù)和添磚加瓦辆布,因此有非常好的一套生態(tài)系統(tǒng)。
如果你希望對(duì)單一長(zhǎng)文本提取若干重要關(guān)鍵詞茶鉴,該怎么辦呢锋玲?
請(qǐng)你閱讀《如何用Python提取中文關(guān)鍵詞?》一文涵叮。它采用詞匯向量化惭蹂、TextRank等成熟的關(guān)鍵詞提取算法來(lái)解決問題。
課間答疑
隨著知識(shí)割粮、技能和經(jīng)驗(yàn)的積累剿干,你的疑問可能也逐漸增多了吧?
有的同學(xué)對(duì)這種教學(xué)方式有疑問——案例挺有意思穆刻,也很簡(jiǎn)單易學(xué)置尔,但是怎么把它用到我自己的學(xué)習(xí)、工作和科研中呢氢伟?
我為你寫了一篇答疑說(shuō)明榜轿,叫做《文科生如何高效學(xué)數(shù)據(jù)科學(xué)?》朵锣。文中提到了以下幾個(gè)方面:
- 如何指定目標(biāo)谬盐?
- 如何確定深度?
- 如何加強(qiáng)協(xié)作诚些?
提到協(xié)作飞傀,就不能不說(shuō)Github這個(gè)全球最大的開源代碼托管倉(cāng)庫(kù)了。
在咱們的教程里诬烹,也多次使用Github來(lái)存儲(chǔ)代碼和數(shù)據(jù)砸烦,以便你能夠重復(fù)運(yùn)行教程中的結(jié)果。
《如何高效入門Github绞吁?》一文提供了文檔和視頻教程資源幢痘,希望能對(duì)你掌握這個(gè)數(shù)據(jù)富礦提供幫助。
不少讀者在這個(gè)階段常提出這個(gè)問題:老師家破,想學(xué)Python颜说,推薦本書唄。
看來(lái)汰聋,你已經(jīng)明白了Python的好處了门粪,對(duì)吧?
《如何高效學(xué)Python烹困?》幫助你給自己的學(xué)習(xí)特性做出了分類玄妈。根據(jù)分類的結(jié)果,你可以選擇更適合自己的學(xué)習(xí)路徑。
推薦的教材措近,不僅包括書籍溶弟,還包括MOOC。希望這種充滿互動(dòng)的教學(xué)方式瞭郑,對(duì)你入門數(shù)據(jù)科學(xué)有幫助辜御。
機(jī)器學(xué)習(xí)
你可以嘗試做更進(jìn)一步的分析了。
例如機(jī)器學(xué)習(xí)(Machine Learning)屈张。
機(jī)器學(xué)習(xí)的妙用擒权,就是在那些你(其實(shí)是人類)無(wú)法準(zhǔn)確描述解決步驟的問題上,讓機(jī)器通過大量案例(數(shù)據(jù))的觀察阁谆、試錯(cuò)碳抄,構(gòu)建一個(gè)相對(duì)有用的模型,來(lái)自動(dòng)化處理問題场绿,或者為人類的決策提供輔助依據(jù)剖效。
大體上,機(jī)器學(xué)習(xí)主要分為3類:
- 監(jiān)督學(xué)習(xí)(Supervised Learning)
- 非監(jiān)督學(xué)習(xí)(Unsupervised Learning)
- 強(qiáng)化學(xué)習(xí)(Reinforcement Learning)
目前本專欄介紹了前兩類的一些例子焰盗。
監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí)最大的差別璧尸,在于數(shù)據(jù)。
數(shù)據(jù)已有標(biāo)注(一般是人工賦予標(biāo)簽)熬拒,一般用監(jiān)督學(xué)習(xí)爷光;
數(shù)據(jù)沒有標(biāo)注,一般只能用非監(jiān)督學(xué)習(xí)澎粟。
監(jiān)督學(xué)習(xí)部分蛀序,我們舉了分類(classification)任務(wù)的例子。
《貸還是不貸:如何用Python和機(jī)器學(xué)習(xí)幫你決策活烙?》中的案例徐裸,選擇了貸款審批輔助決策。
具體的機(jī)器學(xué)習(xí)算法瓣颅,是決策樹(decision tree)倦逐。
有同學(xué)表示,繪制這棵決策樹的時(shí)候宫补,遇到了問題。
這主要是因?yàn)檫\(yùn)行環(huán)境的差異和依賴工具的安裝沒有正確完成曾我。
《Python編程遇問題粉怕,文科生怎么辦?》的第一部分抒巢,對(duì)這些問題做了詳細(xì)的闡述贫贝,請(qǐng)根據(jù)列出的步驟嘗試解決。
不僅如此,這篇文章展示給你了一種任務(wù)導(dǎo)向的學(xué)習(xí)方式稚晚,期望它可以提升你Python語(yǔ)言和數(shù)據(jù)科學(xué)學(xué)習(xí)效率崇堵。
非監(jiān)督學(xué)習(xí)部分,我們講述了《如何用Python從海量文本抽取主題客燕?》鸳劳。
文中用一種叫做LDA的聚類(clustering)方法,幫你從可能感興趣的浩如煙海文檔中也搓,提取出可能的類別赏廓,對(duì)應(yīng)的主要關(guān)鍵詞,并且做可視化處理傍妒。
文中提及了停用詞(stopwords)的處理幔摸,但是沒有給出中文停用詞的具體應(yīng)用方法。
《如何用Python和機(jī)器學(xué)習(xí)訓(xùn)練中文文本情感分類模型颤练?》一文中既忆,我不僅對(duì)停用詞處理方式進(jìn)行了詳細(xì)的介紹,而且把監(jiān)督學(xué)習(xí)Naive Bayes模型應(yīng)用于情感分析嗦玖,手把手教你如何訓(xùn)練自己的情感分類模型患雇。
深度學(xué)習(xí)
深度學(xué)習(xí),指用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network)進(jìn)行機(jī)器學(xué)習(xí)踏揣。
相對(duì)于傳統(tǒng)機(jī)器學(xué)習(xí)方法庆亡,它使用的模型結(jié)構(gòu)更為復(fù)雜,需要更多的數(shù)據(jù)支持捞稿,并且訓(xùn)練起來(lái)要消耗更多的計(jì)算資源和時(shí)間又谋。
常見的深度學(xué)習(xí)應(yīng)用,包括語(yǔ)音識(shí)別娱局、計(jì)算機(jī)視覺和機(jī)器翻譯等彰亥。
當(dāng)然,新聞里面最愛提的衰齐,是下圍棋這個(gè)事兒:
我們提供的案例任斋,沒有那么挑戰(zhàn)人類智能極限,而是跟日常工作和生活更加相關(guān)耻涛。
《如何用Python和深度神經(jīng)網(wǎng)絡(luò)發(fā)現(xiàn)即將流失的客戶废酷?》為你介紹了深度神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)。
這篇文章通過客戶流失預(yù)警的例子抹缕,講述了使用前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行監(jiān)督式學(xué)習(xí)的基本樣例澈蟆。
實(shí)際操作部分,我們采用Tensorflow作為后端卓研,tflearn作為前段趴俘,構(gòu)造你自己的第一個(gè)深度神經(jīng)網(wǎng)絡(luò)睹簇。
《如何用Python和深度神經(jīng)網(wǎng)絡(luò)發(fā)現(xiàn)即將流失的客戶?》一文末尾還為你提供了進(jìn)一步掌握深度學(xué)習(xí)的相關(guān)資源寥闪。
如果你需要安裝Tensorflow深度學(xué)習(xí)框架(Google出品哦)太惠,歡迎先閱讀這篇《Tensorflow執(zhí)行pip升級(jí)安裝的坑》。
有了深度神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí)疲憋,我們折騰計(jì)算機(jī)視覺凿渊。
《如何用Python和深度神經(jīng)網(wǎng)絡(luò)識(shí)別圖像?》一文柜某,舉例分類哆啦a夢(mèng)和瓦力這兩個(gè)機(jī)器人的各種花式圖像集合嗽元。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)這時(shí)就大放異彩了。
這篇文章喂击,幫你分析了卷積神經(jīng)網(wǎng)絡(luò)中剂癌,不同層次(Layer)的作用。
我們盡量避免用公式翰绊,而是用圖像佩谷、動(dòng)圖和平實(shí)簡(jiǎn)潔的語(yǔ)言描述來(lái)為你解釋概念。
我們使用的深度學(xué)習(xí)框架监嗜,是蘋果的TuriCreate谐檀。你會(huì)調(diào)用一個(gè)非常深層次的卷積神經(jīng)網(wǎng)絡(luò),幫我們遷(tou)移(ji)學(xué)(qu)習(xí)(qiao)裁奇,用很少的訓(xùn)練數(shù)據(jù)桐猬,獲得非常高的分類準(zhǔn)確率。
有的讀者自己嘗試刽肠,測(cè)試集準(zhǔn)確率居然達(dá)到100%(視運(yùn)行環(huán)境不同溃肪,有差異),大呼過癮音五”棺可同時(shí)又覺得不可思議。
為了解釋這種“奇跡”躺涝,同時(shí)解答讀者“如何在私有數(shù)據(jù)集上以圖搜圖”的疑問厨钻,我寫了《如何用Python和深度神經(jīng)網(wǎng)絡(luò)尋找近似圖片?》坚嗜。
希望讀過此文夯膀,你對(duì)遷移學(xué)習(xí)(Transfer Learning)有了更深入的認(rèn)識(shí)。
如果這兩篇文章學(xué)完苍蔬,你對(duì)卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí)依然不是很清晰棍郎,也沒關(guān)系,因?yàn)槲业难芯可鷤冊(cè)庥隽送瑯拥膯栴}银室。
為此,我專門錄制了一段講解答疑視頻。
這段視頻里蜈敢,我主要談及了以下幾個(gè)方面:
- 深度神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)辜荠;
- 神經(jīng)元的計(jì)算功能實(shí)現(xiàn);
- 如何對(duì)深度神經(jīng)網(wǎng)絡(luò)做訓(xùn)練抓狭;
- 如何選擇最優(yōu)的模型(超參數(shù)調(diào)整)伯病;
- 卷積神經(jīng)網(wǎng)絡(luò)基本原理;
- 遷移學(xué)習(xí)的實(shí)現(xiàn)否过;
- 疑問解答午笛。
希望看過之后,你再?gòu)恼撐睦镒x到計(jì)算機(jī)視覺的神經(jīng)網(wǎng)絡(luò)模型苗桂,就可以游刃有余了药磺。
另一批作者又來(lái)發(fā)問了:
老師,我用Windows煤伟,死活就是裝不上TuriCreate癌佩,可怎么辦?
我替他們著急的時(shí)候便锨,恰好找到了一個(gè)寶貝围辙。于是寫了《如何免費(fèi)云端運(yùn)行Python深度學(xué)習(xí)框架?》放案。
免費(fèi)使用GPU姚建,用極為簡(jiǎn)易的操作,就可以在Google云端Linux主機(jī)上部署和執(zhí)行蘋果深度學(xué)習(xí)框架……
聽著是不是像做夢(mèng)爸ㄑ场掸冤?
感謝Google這家為人類知識(shí)積累做出貢獻(xiàn)的企業(yè)。
數(shù)據(jù)獲取
學(xué)完深度學(xué)習(xí)之后考婴,你會(huì)發(fā)現(xiàn)自己變成了“數(shù)據(jù)饑渴”癥患者贩虾。
因?yàn)槿绻麤]有大量的數(shù)據(jù),就無(wú)法支撐你的深度神經(jīng)網(wǎng)絡(luò)沥阱。
如何獲取數(shù)據(jù)呢缎罢?
我們先要區(qū)分?jǐn)?shù)據(jù)的來(lái)源。
數(shù)據(jù)來(lái)源很多考杉。但是對(duì)于研究者來(lái)說(shuō)策精,網(wǎng)絡(luò)數(shù)據(jù)和文獻(xiàn)數(shù)據(jù)比較常用。
目前主流(合法)的網(wǎng)絡(luò)數(shù)據(jù)方法崇棠,主要分為3類:
- 開放數(shù)據(jù)集下載咽袜;
- API讀取枕稀;
- 爬蟲爬妊病(Crawling)谜嫉。
《如何用Python讀取開放數(shù)據(jù)?》一文中凹联,我為你講解了如何把開放數(shù)據(jù)集下載并且在Python中使用沐兰。
這篇文章介紹了常見的CSV/Excel, JSON和XML等開放數(shù)據(jù)文件格式的讀取、初步處理和可視化方法與流程蔽挠。
如果沒有開放數(shù)據(jù)集整理好供你下載住闯,網(wǎng)站只提供API接口,你該怎么辦呢澳淑?
《如何用R和API免費(fèi)獲取Web數(shù)據(jù)比原?》一文,我們使用R讀取維基百科API杠巡,獲得指定條目的訪問數(shù)量記錄量窘,并且做了可視化。
如果沒有人為你整理好數(shù)據(jù)忽孽,網(wǎng)站也沒有開放API給你绑改,那你就得“直接上大錘”了。
《如何用Python爬數(shù)據(jù)兄一?(一)網(wǎng)頁(yè)抓取》一文為你介紹了非常人性化厘线、易用的網(wǎng)頁(yè)抓取軟件包 requests_html
,你可以嘗試抓取網(wǎng)頁(yè)內(nèi)的指定類型鏈接出革。
文獻(xiàn)數(shù)據(jù)可能存儲(chǔ)為各種格式造壮,但其中pdf格式較為常見。
應(yīng)諸多讀者的要求骂束,我寫了《如何用Python批量提取PDF文本內(nèi)容耳璧?》。
你可以批量提取pdf文檔的文本內(nèi)容展箱,并且進(jìn)行各種分析旨枯。
文中的分析相對(duì)簡(jiǎn)單,我們只是統(tǒng)計(jì)了文檔字符數(shù)量混驰。
但是發(fā)揮想象力攀隔,你可能會(huì)做出非常有價(jià)值的分析結(jié)果。
希望這些文章可以幫助你高效獲得優(yōu)質(zhì)數(shù)據(jù)栖榨,支撐起你自己的機(jī)器學(xué)習(xí)模型昆汹。
小結(jié)
本文把《玉樹芝蘭》專欄目前的數(shù)據(jù)科學(xué)類文章進(jìn)行了梳理和歸類,建立了鏈接婴栽,以幫你看清它們之間的邏輯依賴關(guān)系满粗。
專欄中,數(shù)據(jù)科學(xué)類文章主要圍繞以下方面展開:
- 環(huán)境搭建愚争;
- 基礎(chǔ)入門映皆;
- 自然語(yǔ)言處理挤聘;
- 機(jī)器學(xué)習(xí);
- 深度學(xué)習(xí)劫扒;
- 數(shù)據(jù)獲让识础;
- 答疑沟饥。
你可能早已發(fā)現(xiàn),我們還有很多話題湾戳,沒有來(lái)得及涉及贤旷。
別著急。
本專欄會(huì)持續(xù)添加新的內(nèi)容砾脑。這篇導(dǎo)讀也會(huì)不定期更新幼驶。歡迎關(guān)注。
討論
本專欄數(shù)據(jù)科學(xué)類的文章里韧衣,你更喜歡哪個(gè)方面的主題盅藻?除此以外,你還希望讀到哪些內(nèi)容畅铭?歡迎留言氏淑,把你的經(jīng)驗(yàn)和思考分享給大家,我們一起交流討論硕噩。
喜歡請(qǐng)點(diǎn)贊假残。還可以微信關(guān)注和置頂我的公眾號(hào)“玉樹芝蘭”(nkwangshuyi)。
如果你對(duì)數(shù)據(jù)科學(xué)感興趣炉擅,不妨閱讀我的系列教程索引貼《如何高效入門數(shù)據(jù)科學(xué)辉懒?》,里面還有更多的有趣問題及解法谍失。