Avatar notebook default
6篇文章 · 13563字 · 7人關(guān)注
  • 文本相似性的總結(jié)

    文本相似性的應(yīng)用場景會有很多香伴,在工業(yè)界我粗略遇到過: 熱點(diǎn)做輿情識別監(jiān)控的時(shí)候,需要對全網(wǎng)文章進(jìn)行聚合,聚合過程中需要知道哪些文章是一致的 推薦...

  • Resize,w 360,h 240
    提升有監(jiān)督學(xué)習(xí)效果的實(shí)戰(zhàn)解析

    前言 最近很長時(shí)間沒有和大家分享東西了,最近一直在忙公司的項(xiàng)目,先說一聲抱歉幕垦。 之前寫過銷售預(yù)估算法,但是被諸多大佬吐槽有監(jiān)督學(xué)習(xí)部分毫無深度,...

  • Resize,w 360,h 240
    Kaggle&TianChi分類問題相關(guān)算法快速實(shí)現(xiàn)

    17/12/30-update :很多朋友私密我想要代碼傅联,甚至利用金錢誘惑我先改,好吧,我淪陷了蒸走。因?yàn)樵即a涉及到公司的特征工程及一些利益tric...

    0.1 1852 2 7 1
  • 應(yīng)用:數(shù)據(jù)預(yù)處理-異常值處理

    檢測異常值一定程度上也可以叫做離群點(diǎn)識別仇奶,常規(guī)有以下幾種識別方法: 1.統(tǒng)計(jì)檢驗(yàn)(假設(shè)檢驗(yàn)) 舉個(gè)例子:以下一組用戶用車月花費(fèi):100,110比驻,...

  • Resize,w 360,h 240
    應(yīng)用:推薦系統(tǒng)-威爾遜區(qū)間法

    我推薦一種之前在惠普做過一種排序方法:威爾遜區(qū)間法 我們先做如下設(shè)定: (1)每個(gè)用戶的打分都是獨(dú)立事件该溯。 (2)用戶只有兩個(gè)選擇,要么投喜歡'...

  • 應(yīng)用:數(shù)據(jù)預(yù)處理-缺失值填充

    個(gè)人不建議填充缺失值别惦,建議設(shè)置啞變量或者剔除該變量狈茉,填充成本較高 常見填充缺失值的方法: 1.均值、眾數(shù)填充掸掸,填充結(jié)果粗糙對模型訓(xùn)練甚至有負(fù)面影...

文集作者

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品