監(jiān)督學(xué)習(xí)對于有標(biāo)簽的特定數(shù)據(jù)集(訓(xùn)練集)是非常有效的泄伪,但是它需要對于其他的距離進(jìn)行預(yù)測索赏。 無監(jiān)督學(xué)習(xí)對于在給定未標(biāo)記的數(shù)據(jù)集(目標(biāo)沒有提前指定)...
HDFS 分布式文件系統(tǒng) 按塊存儲支持大規(guī)模文件存儲簡化系統(tǒng)設(shè)計(jì)數(shù)據(jù)備份 名稱節(jié)點(diǎn)疟羹,整個(gè)HDFS集群的管家咳燕。FsImage和editlog通過s...
第五章 模型評價(jià)方法 5.1 模型的評價(jià)方法介紹 5.1.1~5 accuracy爆雹,precision叔营,recall有巧,F(xiàn)1-score,ROC曲...
面試的時(shí)候回答的不清楚芬膝,學(xué)習(xí)&總結(jié)如下望门。參考link 1.ROC曲線 對于二值分類器,評價(jià)指標(biāo)主要有precision锰霜,recall筹误,F(xiàn)-sco...
協(xié)同過濾推薦系統(tǒng)可以分為基于用戶的推薦和基于項(xiàng)目的推薦。 基本數(shù)據(jù)是用戶對項(xiàng)目的評分表癣缅,預(yù)測稀疏矩陣中空缺項(xiàng)的值厨剪。越稀疏越難。 計(jì)算相似度:co...
步驟: 數(shù)據(jù)與輸出重排打散 bag-of-words詞袋模型詞袋模型 n-gram模型將文本里面的內(nèi)容按照字節(jié)進(jìn)行大小為N的滑動窗口操作友存,形成了...
詞向量 重點(diǎn)在于把符號數(shù)字化祷膳,nlp中最直觀的方法是one-hot representation,每個(gè)詞表示為一個(gè)向量屡立,長度為詞表大小直晨,只有一個(gè)...
一開始提出的是LOOCV方法:每次取出一個(gè)數(shù)據(jù)作為測試集的唯一元素,其他n-1個(gè)元素作為訓(xùn)練集喲用于訓(xùn)練模型和調(diào)參膨俐。經(jīng)過n個(gè)模型勇皇,每次一個(gè)MSE...
百度 一面 TCP協(xié)議C++里繼承的多態(tài) 概率題,6位數(shù)倒過來還是一樣的概率 從袋子里拿紅黑球 2xN的大方塊焚刺,用1x2和2x1填滿有多少種方法...