如何高效入門數(shù)據(jù)科學(xué)厨内?

鏈接散落的教程文章,做個(gè)詳細(xì)的導(dǎo)讀产镐,助你更高效入門數(shù)據(jù)科學(xué)隘庄。

問題

2017年6月以來(lái)踢步,我陸續(xù)在自己的簡(jiǎn)書專欄《玉樹芝蘭》里癣亚,寫了一系列數(shù)據(jù)科學(xué)教程。

這源于一次研究生課編程工作坊嘗試获印。受閻教練的創(chuàng)新思維訓(xùn)練營(yíng)啟發(fā)述雾,我在課后把詞云制作流程詳細(xì)記錄轉(zhuǎn)述,分享給了大家兼丰。

沒想到玻孟,這篇《如何用Python做詞云?》受到了讀者們非常熱烈的歡迎鳍征。

此后黍翎,一發(fā)不可收拾。

應(yīng)讀者的要求艳丛,結(jié)合我自己的學(xué)習(xí)匣掸、科研和教學(xué)實(shí)踐,我陸續(xù)分享了更多與數(shù)據(jù)科學(xué)相關(guān)的文章氮双。

讀者越來(lái)越多碰酝,我收到的問題也愈發(fā)五花八門。

許多讀者的問題戴差,我其實(shí)都已經(jīng)在其他的文章里面講解過了送爸,因此有時(shí)用“請(qǐng)參考我的另一篇文章《……》,鏈接為……”來(lái)答復(fù)暖释,也幫助讀者解決了問題袭厂。

在建構(gòu)同理心(empathy)之前,估計(jì)我會(huì)問出這樣的問題:

他們?yōu)槭裁床环业钠渌恼履兀?/p>

但現(xiàn)在球匕,我能感受到他們的疑惑:

我哪里知道你寫過另一篇文章纹磺?

散落在各處的文章,不容易系統(tǒng)學(xué)習(xí)和檢索谐丢。于是我在2017年11月爽航,把寫過的數(shù)據(jù)科學(xué)系列教程匯集到了一起蚓让,做了個(gè)索引貼

我把這個(gè)索引貼鏈接置于每篇新教程的末尾讥珍,并不斷更新維護(hù)历极。

然而,這樣簡(jiǎn)單的標(biāo)題索引衷佃,依然無(wú)法滿足許多讀者的需求趟卸。

有的讀者跟著教程做完了詞云,發(fā)現(xiàn)如果對(duì)中文文本做分析氏义,就會(huì)出現(xiàn)亂碼:

這時(shí)候锄列,你該怎么辦呢?

更進(jìn)一步惯悠,如果你希望把詞云的外邊框變成指定的形狀邻邮,又該如何操作?

光看標(biāo)題克婶,你可能不容易發(fā)現(xiàn)哪一篇文章會(huì)幫助自己解決這些問題筒严,甚至可能會(huì)選擇放棄

我決定做這個(gè)導(dǎo)讀情萤。

這篇文章鸭蛙,不再是從任務(wù)出發(fā),簡(jiǎn)單羅列文章標(biāo)題和鏈接筋岛;而是從先易后難的認(rèn)知習(xí)慣娶视,重新組織文章順序,簡(jiǎn)要介紹內(nèi)容睁宰,提示可能遇到的問題肪获。

希望對(duì)你的學(xué)習(xí)能有幫助

基礎(chǔ)環(huán)境

大部分的教程勋陪,都是在 Python 運(yùn)行環(huán)境 Jupyter Notebook 下運(yùn)行和演示贪磺。

安裝這個(gè)運(yùn)行環(huán)境,最簡(jiǎn)單的方法诅愚,就是安裝 Anaconda 集成套件寒锚。

請(qǐng)先收看這個(gè)視頻教程《如何安裝Python運(yùn)行環(huán)境Anaconda?(視頻教程)》违孝,自己嘗試安裝Anaconda刹前,運(yùn)行起第一個(gè)Jupyter Notebook,輸出一個(gè)“Hello world!”出來(lái)雌桑。

有了這個(gè)基礎(chǔ)喇喉,你就可以嘗試不同的數(shù)據(jù)科學(xué)任務(wù)了。

我的建議是先做詞云校坑。

因?yàn)楹?jiǎn)單拣技,而且有成就感千诬。

詞云

跟著圖文教程《如何用Python做詞云?》一步步執(zhí)行膏斤。用幾行Python代碼徐绑,你就可以做出這樣的詞云來(lái)。

我還專門把它升級(jí)做成了視頻教程《如何用Python做詞云莫辨?(基礎(chǔ)篇視頻教程)》傲茄,供你觀看。

參看這篇文章《如何用Python做中文分詞沮榜?》盘榨,你就能做出這樣的中文詞云。

如果你希望改變?cè)~云邊框外觀蟆融,就參考這篇文章《Python編程遇問題草巡,文科生怎么辦?》的最后部分振愿。

到這里捷犹,你已掌握Python運(yùn)行環(huán)境安裝弛饭、文本文件讀取冕末、常見軟件包調(diào)用、可視化分析與結(jié)果呈現(xiàn)和中文分詞等基本功夫了侣颂。

回頭望去档桃,是不是成就感爆棚呢?

虛擬環(huán)境

細(xì)心的你憔晒,可能已經(jīng)發(fā)現(xiàn)藻肄,圖文教程和視頻內(nèi)容并不完全一致

視頻教程目前全系列采用Python 3.6版本拒担,未來(lái)得及重新整理的詞云圖文教程嘹屯,展示的確實(shí)2.7版本Python。

為什么呢从撼?

因?yàn)殡S著技術(shù)的發(fā)展州弟,Python已經(jīng)逐步要過渡到3.X版本了。

許多第三方軟件包都已經(jīng)宣布了時(shí)間表低零,盡快支持3.X婆翔,放棄2.X版本的支持。

才半年掏婶,你就可以感受到技術(shù)啃奴、社群和環(huán)境的變化之快。

可是目前某些軟件包雄妥,依然只能支持2.X版本Python最蕾。雖然這樣的軟件包越來(lái)越少了依溯。

你需要暫時(shí)做個(gè)“兩棲動(dòng)物”,千萬(wàn)不要束縛自己瘟则,因?yàn)椤傲?chǎng)原因”固執(zhí)著不肯用低版本Python誓沸。這樣吃虧的是自己。

怎樣才能做個(gè)“兩棲動(dòng)物”呢壹粟?

辦法之一拜隧,就是使用Anaconda的虛擬環(huán)境〕孟桑可以參考《如何在Jupyter Notebook中使用Python虛擬環(huán)境洪添?》。

你初始安裝版本針對(duì)Python 2.7的Anaconda雀费,并不妨礙你快速建立一個(gè)3.6版本Python的虛擬環(huán)境干奢。

有了這個(gè)秘籍,你就可以在不同版本的Python之間左右逢源盏袄,游刃有余了忿峻。

自然語(yǔ)言處理

下一步,我們來(lái)嘗試自然語(yǔ)言處理(Natural Language Processing, NLP)辕羽。

情感分析逛尚,是NLP在許多社會(huì)科學(xué)領(lǐng)域熱門的應(yīng)用之一。

如何用Python做情感分析刁愿?》這篇文章绰寞,分別從英文和中文兩個(gè)案例,分別采用不同的軟件包铣口,針對(duì)性地解決應(yīng)用需求滤钱。

你只需要幾行代碼,就能讓Python告訴你情感的取向脑题。是不是很厲害件缸?

有了情感分析做基礎(chǔ),你可以嘗試增加維度叔遂,對(duì)更大體量的數(shù)據(jù)做分析他炊。

增加時(shí)間維度,就可以持續(xù)分析變化的輿情掏熬。

如何用Python做輿情時(shí)間序列可視化佑稠?》這篇文章,一步步指引你在時(shí)間刻度上可視化情感分析結(jié)果:

這圖難看了一些旗芬。

不過我們需要容忍自己起步時(shí)的笨拙舌胶,不斷迭代與精進(jìn)。

希望一出手就滿分疮丛,對(duì)極少數(shù)天才幔嫂,確實(shí)無(wú)非是日常辆它。

但對(duì)大多數(shù)人,是拖延癥的開始履恩。

你可能迫不及待锰茉,嘗試換自己的數(shù)據(jù)做時(shí)間序列可視化分析。

不過日期數(shù)據(jù)如果與樣例有出入切心,可能會(huì)出現(xiàn)問題飒筑。

這時(shí)候,不要慌绽昏,請(qǐng)參考《Python編程遇問題协屡,文科生怎么辦?》的第二部分全谤,其中有詳細(xì)的錯(cuò)誤原因分析與對(duì)策展示肤晓。

看過后,分析結(jié)果圖也會(huì)迭代成這個(gè)樣子:

到這里认然,你對(duì)情感分析有點(diǎn)兒感覺了吧补憾?

如果你不打算使用第三方提供的情感分類算法,打算自己動(dòng)手訓(xùn)練一個(gè)更為精確的情感分類模型卷员,可以參考《如何用Python和機(jī)器學(xué)習(xí)訓(xùn)練中文文本情感分類模型盈匾?》一文。

剛剛這些情感分析子刮,其實(shí)只是極性分析(正面vs負(fù)面)威酒。但是我們都知道,人的情感其實(shí)是多方面共同構(gòu)成的挺峡。

如何從文本中,分解出多維度的情感特征變化呢担钮?

如何用Python和R對(duì)《權(quán)力的游戲》故事情節(jié)做情緒分析橱赠?》一文分析了《權(quán)力的游戲》中某一集劇本,你會(huì)獲得這樣的結(jié)果:

如果你是《權(quán)力的游戲》劇迷箫津,請(qǐng)告訴我狭姨,這張圖描繪的是哪一集?

先猜猜看苏遥,然后再打開文章饼拍,跟結(jié)尾做對(duì)比。

這篇文章的可視化分析部分田炭,用的是R师抄。

R也是數(shù)據(jù)科學(xué)領(lǐng)域一個(gè)非常受歡迎的開源工具。它的通用性和熱度可能不如Python(畢竟Python除了數(shù)據(jù)科學(xué)教硫,還能干許多其他的事兒)叨吮,但是因?yàn)橛薪y(tǒng)計(jì)學(xué)界諸多科學(xué)家的擁護(hù)和添磚加瓦辆布,因此有非常好的一套生態(tài)系統(tǒng)。

如果你希望對(duì)單一長(zhǎng)文本提取若干重要關(guān)鍵詞茶鉴,該怎么辦呢锋玲?

請(qǐng)你閱讀《如何用Python提取中文關(guān)鍵詞?》一文涵叮。它采用詞匯向量化惭蹂、TextRank等成熟的關(guān)鍵詞提取算法來(lái)解決問題。

課間答疑

隨著知識(shí)割粮、技能和經(jīng)驗(yàn)的積累剿干,你的疑問可能也逐漸增多了吧?

有的同學(xué)對(duì)這種教學(xué)方式有疑問——案例挺有意思穆刻,也很簡(jiǎn)單易學(xué)置尔,但是怎么把它用到我自己的學(xué)習(xí)、工作和科研中呢氢伟?

我為你寫了一篇答疑說(shuō)明榜轿,叫做《文科生如何高效學(xué)數(shù)據(jù)科學(xué)?》朵锣。文中提到了以下幾個(gè)方面:

  • 如何指定目標(biāo)谬盐?
  • 如何確定深度?
  • 如何加強(qiáng)協(xié)作诚些?

提到協(xié)作飞傀,就不能不說(shuō)Github這個(gè)全球最大的開源代碼托管倉(cāng)庫(kù)了。

在咱們的教程里诬烹,也多次使用Github來(lái)存儲(chǔ)代碼和數(shù)據(jù)砸烦,以便你能夠重復(fù)運(yùn)行教程中的結(jié)果。

如何高效入門Github绞吁?》一文提供了文檔和視頻教程資源幢痘,希望能對(duì)你掌握這個(gè)數(shù)據(jù)富礦提供幫助。

不少讀者在這個(gè)階段常提出這個(gè)問題:老師家破,想學(xué)Python颜说,推薦本書唄。

看來(lái)汰聋,你已經(jīng)明白了Python的好處了门粪,對(duì)吧?

如何高效學(xué)Python烹困?》幫助你給自己的學(xué)習(xí)特性做出了分類玄妈。根據(jù)分類的結(jié)果,你可以選擇更適合自己的學(xué)習(xí)路徑。

推薦的教材措近,不僅包括書籍溶弟,還包括MOOC。希望這種充滿互動(dòng)的教學(xué)方式瞭郑,對(duì)你入門數(shù)據(jù)科學(xué)有幫助辜御。

機(jī)器學(xué)習(xí)

你可以嘗試做更進(jìn)一步的分析了。

例如機(jī)器學(xué)習(xí)(Machine Learning)屈张。

機(jī)器學(xué)習(xí)的妙用擒权,就是在那些你(其實(shí)是人類)無(wú)法準(zhǔn)確描述解決步驟的問題上,讓機(jī)器通過大量案例(數(shù)據(jù))的觀察阁谆、試錯(cuò)碳抄,構(gòu)建一個(gè)相對(duì)有用的模型,來(lái)自動(dòng)化處理問題场绿,或者為人類的決策提供輔助依據(jù)剖效。

大體上,機(jī)器學(xué)習(xí)主要分為3類:

  • 監(jiān)督學(xué)習(xí)(Supervised Learning)
  • 非監(jiān)督學(xué)習(xí)(Unsupervised Learning)
  • 強(qiáng)化學(xué)習(xí)(Reinforcement Learning)

目前本專欄介紹了前兩類的一些例子焰盗。

監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí)最大的差別璧尸,在于數(shù)據(jù)。

數(shù)據(jù)已有標(biāo)注(一般是人工賦予標(biāo)簽)熬拒,一般用監(jiān)督學(xué)習(xí)爷光;

數(shù)據(jù)沒有標(biāo)注,一般只能用非監(jiān)督學(xué)習(xí)澎粟。

監(jiān)督學(xué)習(xí)部分蛀序,我們舉了分類(classification)任務(wù)的例子。

貸還是不貸:如何用Python和機(jī)器學(xué)習(xí)幫你決策活烙?》中的案例徐裸,選擇了貸款審批輔助決策。

具體的機(jī)器學(xué)習(xí)算法瓣颅,是決策樹(decision tree)倦逐。

有同學(xué)表示,繪制這棵決策樹的時(shí)候宫补,遇到了問題。

這主要是因?yàn)檫\(yùn)行環(huán)境的差異和依賴工具的安裝沒有正確完成曾我。

Python編程遇問題粉怕,文科生怎么辦?》的第一部分抒巢,對(duì)這些問題做了詳細(xì)的闡述贫贝,請(qǐng)根據(jù)列出的步驟嘗試解決。

不僅如此,這篇文章展示給你了一種任務(wù)導(dǎo)向的學(xué)習(xí)方式稚晚,期望它可以提升你Python語(yǔ)言和數(shù)據(jù)科學(xué)學(xué)習(xí)效率崇堵。

非監(jiān)督學(xué)習(xí)部分,我們講述了《如何用Python從海量文本抽取主題客燕?》鸳劳。

文中用一種叫做LDA的聚類(clustering)方法,幫你從可能感興趣的浩如煙海文檔中也搓,提取出可能的類別赏廓,對(duì)應(yīng)的主要關(guān)鍵詞,并且做可視化處理傍妒。

文中提及了停用詞(stopwords)的處理幔摸,但是沒有給出中文停用詞的具體應(yīng)用方法。

如何用Python和機(jī)器學(xué)習(xí)訓(xùn)練中文文本情感分類模型颤练?》一文中既忆,我不僅對(duì)停用詞處理方式進(jìn)行了詳細(xì)的介紹,而且把監(jiān)督學(xué)習(xí)Naive Bayes模型應(yīng)用于情感分析嗦玖,手把手教你如何訓(xùn)練自己的情感分類模型患雇。

深度學(xué)習(xí)

深度學(xué)習(xí),指用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network)進(jìn)行機(jī)器學(xué)習(xí)踏揣。

相對(duì)于傳統(tǒng)機(jī)器學(xué)習(xí)方法庆亡,它使用的模型結(jié)構(gòu)更為復(fù)雜,需要更多的數(shù)據(jù)支持捞稿,并且訓(xùn)練起來(lái)要消耗更多的計(jì)算資源和時(shí)間又谋。

常見的深度學(xué)習(xí)應(yīng)用,包括語(yǔ)音識(shí)別娱局、計(jì)算機(jī)視覺和機(jī)器翻譯等彰亥。

當(dāng)然,新聞里面最愛提的衰齐,是下圍棋這個(gè)事兒:

我們提供的案例任斋,沒有那么挑戰(zhàn)人類智能極限,而是跟日常工作和生活更加相關(guān)耻涛。

如何用Python和深度神經(jīng)網(wǎng)絡(luò)發(fā)現(xiàn)即將流失的客戶废酷?》為你介紹了深度神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)。

這篇文章通過客戶流失預(yù)警的例子抹缕,講述了使用前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行監(jiān)督式學(xué)習(xí)的基本樣例澈蟆。

實(shí)際操作部分,我們采用Tensorflow作為后端卓研,tflearn作為前段趴俘,構(gòu)造你自己的第一個(gè)深度神經(jīng)網(wǎng)絡(luò)睹簇。

如何用Python和深度神經(jīng)網(wǎng)絡(luò)發(fā)現(xiàn)即將流失的客戶?》一文末尾還為你提供了進(jìn)一步掌握深度學(xué)習(xí)的相關(guān)資源寥闪。

如果你需要安裝Tensorflow深度學(xué)習(xí)框架(Google出品哦)太惠,歡迎先閱讀這篇《Tensorflow執(zhí)行pip升級(jí)安裝的坑》。

有了深度神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí)疲憋,我們折騰計(jì)算機(jī)視覺凿渊。

如何用Python和深度神經(jīng)網(wǎng)絡(luò)識(shí)別圖像?》一文柜某,舉例分類哆啦a夢(mèng)和瓦力這兩個(gè)機(jī)器人的各種花式圖像集合嗽元。

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)這時(shí)就大放異彩了。

這篇文章喂击,幫你分析了卷積神經(jīng)網(wǎng)絡(luò)中剂癌,不同層次(Layer)的作用。

我們盡量避免用公式翰绊,而是用圖像佩谷、動(dòng)圖和平實(shí)簡(jiǎn)潔的語(yǔ)言描述來(lái)為你解釋概念。

我們使用的深度學(xué)習(xí)框架监嗜,是蘋果的TuriCreate谐檀。你會(huì)調(diào)用一個(gè)非常深層次的卷積神經(jīng)網(wǎng)絡(luò),幫我們遷(tou)移(ji)學(xué)(qu)習(xí)(qiao)裁奇,用很少的訓(xùn)練數(shù)據(jù)桐猬,獲得非常高的分類準(zhǔn)確率。

有的讀者自己嘗試刽肠,測(cè)試集準(zhǔn)確率居然達(dá)到100%(視運(yùn)行環(huán)境不同溃肪,有差異),大呼過癮音五”棺可同時(shí)又覺得不可思議。

為了解釋這種“奇跡”躺涝,同時(shí)解答讀者“如何在私有數(shù)據(jù)集上以圖搜圖”的疑問厨钻,我寫了《如何用Python和深度神經(jīng)網(wǎng)絡(luò)尋找近似圖片?》坚嗜。

希望讀過此文夯膀,你對(duì)遷移學(xué)習(xí)(Transfer Learning)有了更深入的認(rèn)識(shí)。

如果這兩篇文章學(xué)完苍蔬,你對(duì)卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí)依然不是很清晰棍郎,也沒關(guān)系,因?yàn)槲业难芯可鷤冊(cè)庥隽送瑯拥膯栴}银室。

為此,我專門錄制了一段講解答疑視頻

這段視頻里蜈敢,我主要談及了以下幾個(gè)方面:

  • 深度神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)辜荠;
  • 神經(jīng)元的計(jì)算功能實(shí)現(xiàn);
  • 如何對(duì)深度神經(jīng)網(wǎng)絡(luò)做訓(xùn)練抓狭;
  • 如何選擇最優(yōu)的模型(超參數(shù)調(diào)整)伯病;
  • 卷積神經(jīng)網(wǎng)絡(luò)基本原理;
  • 遷移學(xué)習(xí)的實(shí)現(xiàn)否过;
  • 疑問解答午笛。

希望看過之后,你再?gòu)恼撐睦镒x到計(jì)算機(jī)視覺的神經(jīng)網(wǎng)絡(luò)模型苗桂,就可以游刃有余了药磺。

另一批作者又來(lái)發(fā)問了:

老師,我用Windows煤伟,死活就是裝不上TuriCreate癌佩,可怎么辦?

我替他們著急的時(shí)候便锨,恰好找到了一個(gè)寶貝围辙。于是寫了《如何免費(fèi)云端運(yùn)行Python深度學(xué)習(xí)框架?》放案。

免費(fèi)使用GPU姚建,用極為簡(jiǎn)易的操作,就可以在Google云端Linux主機(jī)上部署和執(zhí)行蘋果深度學(xué)習(xí)框架……

聽著是不是像做夢(mèng)爸ㄑ场掸冤?

感謝Google這家為人類知識(shí)積累做出貢獻(xiàn)的企業(yè)。

數(shù)據(jù)獲取

學(xué)完深度學(xué)習(xí)之后考婴,你會(huì)發(fā)現(xiàn)自己變成了“數(shù)據(jù)饑渴”癥患者贩虾。

因?yàn)槿绻麤]有大量的數(shù)據(jù),就無(wú)法支撐你的深度神經(jīng)網(wǎng)絡(luò)沥阱。

如何獲取數(shù)據(jù)呢缎罢?

我們先要區(qū)分?jǐn)?shù)據(jù)的來(lái)源。

數(shù)據(jù)來(lái)源很多考杉。但是對(duì)于研究者來(lái)說(shuō)策精,網(wǎng)絡(luò)數(shù)據(jù)和文獻(xiàn)數(shù)據(jù)比較常用。

目前主流(合法)的網(wǎng)絡(luò)數(shù)據(jù)方法崇棠,主要分為3類:

  • 開放數(shù)據(jù)集下載咽袜;
  • API讀取枕稀;
  • 爬蟲爬妊病(Crawling)谜嫉。

如何用Python讀取開放數(shù)據(jù)?》一文中凹联,我為你講解了如何把開放數(shù)據(jù)集下載并且在Python中使用沐兰。

這篇文章介紹了常見的CSV/Excel, JSON和XML等開放數(shù)據(jù)文件格式的讀取、初步處理和可視化方法與流程蔽挠。

如果沒有開放數(shù)據(jù)集整理好供你下載住闯,網(wǎng)站只提供API接口,你該怎么辦呢澳淑?

如何用R和API免費(fèi)獲取Web數(shù)據(jù)比原?》一文,我們使用R讀取維基百科API杠巡,獲得指定條目的訪問數(shù)量記錄量窘,并且做了可視化。

如果沒有人為你整理好數(shù)據(jù)忽孽,網(wǎng)站也沒有開放API給你绑改,那你就得“直接上大錘”了。

如何用Python爬數(shù)據(jù)兄一?(一)網(wǎng)頁(yè)抓取》一文為你介紹了非常人性化厘线、易用的網(wǎng)頁(yè)抓取軟件包 requests_html,你可以嘗試抓取網(wǎng)頁(yè)內(nèi)的指定類型鏈接出革。

文獻(xiàn)數(shù)據(jù)可能存儲(chǔ)為各種格式造壮,但其中pdf格式較為常見。

應(yīng)諸多讀者的要求骂束,我寫了《如何用Python批量提取PDF文本內(nèi)容耳璧?》。

你可以批量提取pdf文檔的文本內(nèi)容展箱,并且進(jìn)行各種分析旨枯。

文中的分析相對(duì)簡(jiǎn)單,我們只是統(tǒng)計(jì)了文檔字符數(shù)量混驰。

但是發(fā)揮想象力攀隔,你可能會(huì)做出非常有價(jià)值的分析結(jié)果。

希望這些文章可以幫助你高效獲得優(yōu)質(zhì)數(shù)據(jù)栖榨,支撐起你自己的機(jī)器學(xué)習(xí)模型昆汹。

小結(jié)

本文把《玉樹芝蘭》專欄目前的數(shù)據(jù)科學(xué)類文章進(jìn)行了梳理和歸類,建立了鏈接婴栽,以幫你看清它們之間的邏輯依賴關(guān)系满粗。

專欄中,數(shù)據(jù)科學(xué)類文章主要圍繞以下方面展開:

  • 環(huán)境搭建愚争;
  • 基礎(chǔ)入門映皆;
  • 自然語(yǔ)言處理挤聘;
  • 機(jī)器學(xué)習(xí);
  • 深度學(xué)習(xí)劫扒;
  • 數(shù)據(jù)獲让识础;
  • 答疑沟饥。

你可能早已發(fā)現(xiàn),我們還有很多話題湾戳,沒有來(lái)得及涉及贤旷。

別著急。

本專欄會(huì)持續(xù)添加新的內(nèi)容砾脑。這篇導(dǎo)讀也會(huì)不定期更新幼驶。歡迎關(guān)注。

討論

本專欄數(shù)據(jù)科學(xué)類的文章里韧衣,你更喜歡哪個(gè)方面的主題盅藻?除此以外,你還希望讀到哪些內(nèi)容畅铭?歡迎留言氏淑,把你的經(jīng)驗(yàn)和思考分享給大家,我們一起交流討論硕噩。

喜歡請(qǐng)點(diǎn)贊假残。還可以微信關(guān)注和置頂我的公眾號(hào)“玉樹芝蘭”(nkwangshuyi)

如果你對(duì)數(shù)據(jù)科學(xué)感興趣炉擅,不妨閱讀我的系列教程索引貼《如何高效入門數(shù)據(jù)科學(xué)辉懒?》,里面還有更多的有趣問題及解法谍失。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末眶俩,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子快鱼,更是在濱河造成了極大的恐慌颠印,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,214評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件攒巍,死亡現(xiàn)場(chǎng)離奇詭異嗽仪,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)柒莉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門闻坚,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人兢孝,你說(shuō)我怎么就攤上這事窿凤〗鲑耍” “怎么了?”我有些...
    開封第一講書人閱讀 152,543評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)钞护。 經(jīng)常有香客問我搓扯,道長(zhǎng),這世上最難降的妖魔是什么座咆? 我笑而不...
    開封第一講書人閱讀 55,221評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮仓洼,結(jié)果婚禮上介陶,老公的妹妹穿的比我還像新娘。我一直安慰自己色建,他們只是感情好哺呜,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,224評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著箕戳,像睡著了一般某残。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上陵吸,一...
    開封第一講書人閱讀 49,007評(píng)論 1 284
  • 那天玻墅,我揣著相機(jī)與錄音,去河邊找鬼走越。 笑死椭豫,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的旨指。 我是一名探鬼主播赏酥,決...
    沈念sama閱讀 38,313評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼谆构!你這毒婦竟也來(lái)了裸扶?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,956評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤搬素,失蹤者是張志新(化名)和其女友劉穎呵晨,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體熬尺,經(jīng)...
    沈念sama閱讀 43,441評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡摸屠,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,925評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了粱哼。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片季二。...
    茶點(diǎn)故事閱讀 38,018評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出胯舷,到底是詐尸還是另有隱情刻蚯,我是刑警寧澤,帶...
    沈念sama閱讀 33,685評(píng)論 4 322
  • 正文 年R本政府宣布桑嘶,位于F島的核電站炊汹,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏逃顶。R本人自食惡果不足惜讨便,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,234評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望口蝠。 院中可真熱鬧器钟,春花似錦、人聲如沸妙蔗。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)眉反。三九已至,卻和暖如春穆役,著一層夾襖步出監(jiān)牢的瞬間寸五,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評(píng)論 1 261
  • 我被黑心中介騙來(lái)泰國(guó)打工耿币, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留梳杏,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,467評(píng)論 2 352
  • 正文 我出身青樓淹接,卻偏偏與公主長(zhǎng)得像十性,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子塑悼,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,762評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容