
一纺阔、為什么用余弦相似度瘸彤,而不是歐式距離笛钝? 余弦相似度:取值范圍[-1,1]余弦距離=1-余弦相似度:取值范圍[0,2] 余弦相似度在高維的情況下...
“邏輯回歸假設數(shù)據(jù)服從伯努利分布,通過極大化似然函數(shù)的方法低零,運用梯度下降來求解參數(shù),來達到將數(shù)據(jù)二分類的目的” 上面這句話是對邏輯回歸的一個高度...
缺失值的處理辦法: 刪除法: 簡單刪除法:此方法將存在缺失值的數(shù)據(jù)條目(對象掏婶,元組,記錄)進行刪除 權(quán)重法:當缺失值的類型為非完全隨機缺失的時候...
classifier.coef_
箱線圖五要素: 最大值 四分之三分位數(shù) 中位數(shù) (圖中紅線) 四分之一分位數(shù) 最小值
異常點檢測-孤立森林Isolation Forest 1.基于劃分的思想:假設我們用一個隨機超平面來切割(split)數(shù)據(jù)空間(data spa...
手肘法 - 核心指標:SSE(sum of the squared errors依溯,誤差平方和) Ci是第i個簇 p是Ci中的樣本點 mi是Ci的...
ID3 C4.5 CART 隨機森林 bagging boosting Adaboost GBDT xgboost
損失函數(shù)簡要介紹 0-1損失 絕對值損失 log對數(shù)損失函數(shù) 平方損失函數(shù) 指數(shù)損失函數(shù) Hinge損失函數(shù) 損失函數(shù) 用來評價模型的預測值和真...