加載數(shù)據(jù) 分類器 評估
RawData Over-sampling RandomOverSample SMOTE ADASYN BorderlineSMOTE Unde...
FP-growth(頻繁模式增長) 數(shù)據(jù)庫的第一遍掃描用來統(tǒng)計出現(xiàn)的頻率葬燎;第二遍掃面中考慮那些頻繁元素 優(yōu)點: 大約比Apriori算法快一個數(shù)...
關(guān)聯(lián)分析概念: 關(guān)聯(lián)分析是一種在大規(guī)模數(shù)據(jù)集中尋找有趣關(guān)系的任務(wù)渡蜻;目標(biāo)是發(fā)現(xiàn)頻繁項集和發(fā)現(xiàn)關(guān)聯(lián)規(guī)則; 頻繁項集:是經(jīng)常出項在一塊的物品的集合眠蚂; ...
原理 聚類是無監(jiān)督學(xué)習(xí)辐董,將相似的對象歸到同一個簇中甚亭,簇內(nèi)的對象越相似,聚類的效果越好怔匣; 首先握联,隨機(jī)確定K個初始點作為質(zhì)心桦沉; 然后,將數(shù)據(jù)集中的每...
原理: 將數(shù)據(jù)集切分成很多份易建模的數(shù)據(jù) 利用線性回歸技術(shù)建模 優(yōu)點 可以對復(fù)雜和非線性的數(shù)據(jù)建模 缺點 結(jié)果不易理解 適用數(shù)據(jù)類型 數(shù)值型和標(biāo)...
線性回歸 原理: 尋找一組最優(yōu)參數(shù)來擬合數(shù)據(jù) 優(yōu)點 結(jié)果易于理解金闽,計算上不復(fù)雜 缺點 對非線性的數(shù)據(jù)擬合不好 適用數(shù)據(jù)類型 數(shù)值型和標(biāo)稱型數(shù)據(jù) ...
原理: 通過改變訓(xùn)練樣本的權(quán)重纯露,學(xué)習(xí)多個分類器,并將這些分類器進(jìn)行線性組合代芜,提高分類的性能埠褪; bagging是通過隨機(jī)抽樣的替換方式,得到與原數(shù)...
天池o2o優(yōu)惠券使用預(yù)測比賽解析(初級) 賽題鏈接: 天池o2o優(yōu)惠券使用預(yù)測 加載數(shù)據(jù) 缺失值處理 統(tǒng)計 比賽的意義是把優(yōu)惠券給那要購買商品卻...