240 發(fā)簡信
IP屬地:天津
  • python 實(shí)現(xiàn)樣本抽樣

    單純隨機(jī)抽樣 重復(fù)隨機(jī)抽樣 系統(tǒng)抽樣 分層抽樣先按對觀察指標(biāo)影響較大的某種特征弦赖,將總體分為若干個(gè)類別项栏,再從每一層內(nèi)按上述抽樣方法抽取一定比例的觀察單位,合起來組成樣本蹬竖。

  • 大量數(shù)據(jù)去重方案

    數(shù)據(jù)庫中有有一張表專門存儲用戶的維度數(shù)據(jù)沼沈,由于隨著時(shí)間的推移,用戶的維度數(shù)據(jù)也可能發(fā)生變化币厕,故每一次查看都會保存一次記錄×辛恚現(xiàn)在需要對數(shù)據(jù)按用戶分析,但當(dāng)中有大量的重復(fù)數(shù)據(jù)旦装,僅...

  • 模型評價(jià)指標(biāo)

    評價(jià)指標(biāo) 常用的術(shù)語True positives(TP): 被正確地劃分為正例的個(gè)數(shù)页衙,即實(shí)際為正例且被分類器劃分為正例的實(shí)例數(shù)(樣本數(shù));False positives(F...

  • 數(shù)據(jù)可視化基礎(chǔ)學(xué)習(xí)摘要

    數(shù)據(jù)可視化參考流程 科學(xué)可視化的早期可視化流水線阴绢,描述了從數(shù)據(jù)空間到可視空間的映射拷姿,包含串行處理數(shù)據(jù)的各個(gè)階段: 原始數(shù)據(jù)->數(shù)據(jù)分析->預(yù)處理數(shù)據(jù)->過濾->關(guān)注數(shù)據(jù)->映...

  • docker for windows 10 初次搗騰

    之前就覺得docker 是個(gè)很吊的東西,也在電腦上裝了docker,但是一直都比較忙旱函,所以也忘了响巢,最近突然想起就重新開始試玩了一下。 鏡像由于國外鏡像太慢棒妨,所以后來找了一個(gè)國...

  • 240
    sklearn決策樹使用(1)

    簡介 自2007年發(fā)布以來踪古,scikit-learn已經(jīng)成為Python重要的機(jī)器學(xué)習(xí)庫了。scikit-learn簡稱sklearn券腔,支持包括分類伏穆、回歸、降維和聚類四大機(jī)器...

  • Hadoop, HBase, Hive, ZooKeeper默認(rèn)端口說明

    組件 |Daemon |端口 |配置 |說明--|HDFS |DataNode |50010 |dfs.datanode.address |datanode...

  • 240
    sklearn決策樹使用(2)

    繼昨天使用sklearn的決策樹分類器生成樹圖后纷纫,今天回到實(shí)際應(yīng)用中枕扫。生成的圖片可以使我們更直觀的分析樹圖是否有背常理以及貼近實(shí)際業(yè)務(wù)情況。但是需要把實(shí)際樹讓開發(fā)人員嵌入到服...

  • 240
    Hbase初探

    背景 由于項(xiàng)目需求數(shù)據(jù)本地話保存辱魁,而且數(shù)據(jù)主要為json格式的大塊非結(jié)構(gòu)化數(shù)據(jù)烟瞧,并且線上情況以每日50G的速度在增長,所以數(shù)據(jù)本地話保存的需求也是比較緊急染簇,為方面以后大數(shù)據(jù)方...

個(gè)人介紹
一個(gè)一直在金融行業(yè)的程序員
亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品