更新于2017年6月26日,在第二部分?jǐn)?shù)據(jù)探索時(shí),根據(jù)@Radon的建議溪掀,為了消除極值對(duì)結(jié)果的影響媳瞪,在統(tǒng)計(jì)比例前去除了離群點(diǎn)(outliers)...
更新于2017年6月26日,在第二部分?jǐn)?shù)據(jù)探索時(shí),根據(jù)@Radon的建議溪掀,為了消除極值對(duì)結(jié)果的影響媳瞪,在統(tǒng)計(jì)比例前去除了離群點(diǎn)(outliers)...
前言 為了找到最傷感的一首歌敛瓷,我分析了王力宏叁巨,周杰倫,林俊杰和潘瑋柏32萬(wàn)字歌詞琐驴。 本項(xiàng)目受到《我分析了42萬(wàn)字歌詞俘种,就為了搞清楚民謠歌手們?cè)诔?..
注:1.本項(xiàng)目所有的代碼均放在了我的GitHub上,戳我戳我進(jìn)行訪問(wèn)牢酵。2. 感謝周同學(xué)的指點(diǎn)悬包,補(bǔ)充了關(guān)于所屬行業(yè)的分析以及調(diào)整了多項(xiàng)計(jì)數(shù)的方式。...
因?yàn)橛型瑢W(xué)反映英文版看得太心累馍乙,所以翻譯了一下布近,如果有任何錯(cuò)誤,歡迎指正丝格。 英文版可以戳這里撑瞧,后期可能會(huì)加上每個(gè)技能要求背后學(xué)習(xí)地址的鏈接。 總...
為了保證每周找點(diǎn)事做(爭(zhēng)取每周寫(xiě)一篇),我決定對(duì)我最近在學(xué)習(xí)數(shù)據(jù)分析的某在線平臺(tái)下手曼尊,研究分析下該平臺(tái)收費(fèi)課程的質(zhì)量酬诀。我是一個(gè)在線學(xué)習(xí)重度愛(ài)好者...
最近小組作業(yè)在分析Ritz酒店的業(yè)績(jī)變化,剛好做了簡(jiǎn)單的一幅圖骆撇。 這幅圖是反映了Ritz酒店從2005年到2016年的一個(gè)整體入住率表現(xiàn)瞒御。這張圖...
前幾天接觸了一下pyspider,最近又在復(fù)習(xí)pandas神郊,所以打算拿豆瓣的數(shù)據(jù)來(lái)練練手肴裙。 這次我的目標(biāo)是分析一下豆瓣2016年國(guó)產(chǎn)影視劇的情況...
作為一個(gè)數(shù)據(jù)分析的新手,最近我也在kaggle上晃蕩涌乳,不過(guò)主要是觀摩大師以及尋找有趣的數(shù)據(jù)集的践宴。這不,今天早上發(fā)現(xiàn)了一個(gè)星巴克的數(shù)據(jù)集爷怀,下載下來(lái)...
這幾天在學(xué)數(shù)據(jù)視覺(jué)化阻肩,學(xué)到了d3.js和基于d3的dimple.js。Dimple.js雖然和d3比缺少了靈活性,但是上手比較簡(jiǎn)單烤惊,只要幾行代碼...
Ultimate Skill Checklist For Data Analyst Contents Programming Statistic...