文章轉(zhuǎn)載 https://zhuanlan.zhihu.com/p/25951427,后面收集到更多的會做一個補充。 1厦取、風(fēng)控系統(tǒng)篇 1.1 A...
組件 |Daemon |端口 |配置 |說明--|HDFS |DataNode |50010 |dfs.datanode.addr...
背景 由于項目需求數(shù)據(jù)本地話保存,而且數(shù)據(jù)主要為json格式的大塊非結(jié)構(gòu)化數(shù)據(jù)雌澄,并且線上情況以每日50G的速度在增長培慌,所以數(shù)據(jù)本地話保存的需求也...
繼昨天使用sklearn的決策樹分類器生成樹圖后图筹,今天回到實際應(yīng)用中卫漫。生成的圖片可以使我們更直觀的分析樹圖是否有背常理以及貼近實際業(yè)務(wù)情況菲饼。但是...
簡介 自2007年發(fā)布以來,scikit-learn已經(jīng)成為Python重要的機(jī)器學(xué)習(xí)庫了汛兜。scikit-learn簡稱sklearn巴粪,支持包括...
之前就覺得docker 是個很吊的東西通今,也在電腦上裝了docker,但是一直都比較忙粥谬,所以也忘了肛根,最近突然想起就重新開始試玩了一下。 鏡像由于國...
數(shù)據(jù)可視化參考流程 科學(xué)可視化的早期可視化流水線漏策,描述了從數(shù)據(jù)空間到可視空間的映射派哲,包含串行處理數(shù)據(jù)的各個階段: 原始數(shù)據(jù)->數(shù)據(jù)分析->預(yù)處理...
評價指標(biāo) 常用的術(shù)語True positives(TP): 被正確地劃分為正例的個數(shù),即實際為正例且被分類器劃分為正例的實例數(shù)(樣本數(shù))掺喻;Fa...
單純隨機(jī)抽樣 重復(fù)隨機(jī)抽樣 系統(tǒng)抽樣 分層抽樣先按對觀察指標(biāo)影響較大的某種特征芭届,將總體分為若干個類別,再從每一層內(nèi)按上述抽樣方法抽取一定比例的觀...