240 發(fā)簡(jiǎn)信
IP屬地:北京
  • 模型融合 組合模型

    場(chǎng)景: 廣告排序 文檔排序 方案:多指標(biāo)融合排序 單指標(biāo) CTR CVR : 電話、短信、微聊 頁面停留時(shí)間 融合 類比高考科目的平均分方案 注...

  • 文本分類(多分類問題)

    項(xiàng)目場(chǎng)景: 簡(jiǎn)歷,很多藍(lán)領(lǐng)領(lǐng)域分類多,需要根據(jù)簡(jiǎn)歷內(nèi)容扣癣,進(jìn)行智能分類 轉(zhuǎn)轉(zhuǎn),二手物品類目380-600左右的類目,需要根據(jù)內(nèi)容進(jìn)行智能分類闷沥,提示...

  • 反作弊

    思路: 作弊者都是為了一定的目的,且會(huì)不斷更換作弊方式咐容。觀其行 IP 黑名單 IMEI UserID 高頻搜索舆逃、高頻率點(diǎn)擊 重復(fù)title / ...

  • 海量文檔的去重

    思路: 文本的向量化表示1.1 simhash在線去重 抽屜原理1.2 word2vec1.3 bagofwords(one-hot; tf-i...

  • Resize,w 360,h 240
    瓶頸分析 -- 從樣本到訓(xùn)練流程優(yōu)化

    訓(xùn)練模型優(yōu)化方案: 時(shí)間瓶頸分析: 流程:相同打分-》抽樣-》離散化 -》樣本轉(zhuǎn)labeledPoint -》lr train --》特征有效性...

  • Resize,w 360,h 240
    頁面停留時(shí)間的特征有效性分析

    需求: “每人可以根據(jù)自己的指標(biāo)對(duì)應(yīng)的特征有效性分析,提取出推薦給產(chǎn)品線在列表頁中展示的一些重要特征,引導(dǎo)用戶對(duì)排序結(jié)果的選擇路狮、形成正向反饋” ...

  • 頁面停留時(shí)間 做指標(biāo)

    首先虫啥,統(tǒng)計(jì)頁面停留時(shí)間 然后,將頁面停留時(shí)間 做回歸或者分類(目前奄妨,使用分類模型) 注:頁面停留時(shí)間是連續(xù)值涂籽,但可以中位數(shù),進(jìn)行二值化砸抛。以A用戶...

  • Resize,w 360,h 240
    hive 優(yōu)化

    hive 已經(jīng)自動(dòng)mapjoin優(yōu)化评雌,將小表載入到內(nèi)存;不需要再mapjoin 設(shè)置直焙。但是skewjoin 還是得手動(dòng)設(shè)置(你可每次都添加此設(shè)置...

  • rm * 導(dǎo)致的災(zāi)難性問題

    問題: 案例1:A實(shí)習(xí)生不小心用rm * xxx,多了一個(gè)空格景东;將大家工作目錄刪除了。找運(yùn)維也沒有完全恢復(fù)奔誓,花費(fèi)2個(gè)月補(bǔ)救案例2:B用戶rm *...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品