茶盡 - 簡書

茶盡

IP屬地：北京

十個(gè)基礎(chǔ)算法
監(jiān)督學(xué)習(xí)對于有標(biāo)簽的特定數(shù)據(jù)集（訓(xùn)練集）是非常有效的泄伪，但是它需要對于其他的距離進(jìn)行預(yù)測索赏。無監(jiān)督學(xué)習(xí)對于在給定未標(biāo)記的數(shù)據(jù)集（目標(biāo)沒有提前指定）...

312 0 0
大數(shù)據(jù)
HDFS 分布式文件系統(tǒng) 按塊存儲支持大規(guī)模文件存儲簡化系統(tǒng)設(shè)計(jì)數(shù)據(jù)備份名稱節(jié)點(diǎn)疟羹，整個(gè)HDFS集群的管家咳燕。FsImage和editlog通過s...

589 0 0

模型評價(jià)方法
第五章模型評價(jià)方法 5.1 模型的評價(jià)方法介紹 5.1.1~5 accuracy爆雹，precision叔营，recall有巧，F(xiàn)1-score，ROC曲...

0.4 14966 3 9
auc計(jì)算方法總結(jié)
面試的時(shí)候回答的不清楚芬膝，學(xué)習(xí)&總結(jié)如下望门。參考link 1.ROC曲線對于二值分類器，評價(jià)指標(biāo)主要有precision锰霜，recall筹误，F(xiàn)-sco...

0.1 13010 0 1
cf
協(xié)同過濾推薦系統(tǒng)可以分為基于用戶的推薦和基于項(xiàng)目的推薦。基本數(shù)據(jù)是用戶對項(xiàng)目的評分表癣缅，預(yù)測稀疏矩陣中空缺項(xiàng)的值厨剪。越稀疏越難。計(jì)算相似度：co...

326 0 0
情感分析
步驟：數(shù)據(jù)與輸出重排打散 bag-of-words詞袋模型詞袋模型 n-gram模型將文本里面的內(nèi)容按照字節(jié)進(jìn)行大小為N的滑動窗口操作友存，形成了...

940 1 0
詞向量模型
詞向量重點(diǎn)在于把符號數(shù)字化祷膳，nlp中最直觀的方法是one-hot representation，每個(gè)詞表示為一個(gè)向量屡立，長度為詞表大小直晨，只有一個(gè)...

1783 2 0

cross-validation
一開始提出的是LOOCV方法：每次取出一個(gè)數(shù)據(jù)作為測試集的唯一元素，其他n-1個(gè)元素作為訓(xùn)練集喲用于訓(xùn)練模型和調(diào)參膨俐。經(jīng)過n個(gè)模型勇皇，每次一個(gè)MSE...

401 0 0
面試復(fù)盤
百度一面 TCP協(xié)議C++里繼承的多態(tài) 概率題，6位數(shù)倒過來還是一樣的概率從袋子里拿紅黑球 2xN的大方塊焚刺，用1x2和2x1填滿有多少種方法...

253 0 1