? ? ?? Kaggle比賽首頁有兩個持續(xù)進(jìn)行的項(xiàng)目赤炒,其中一個是回歸類型。自2016年以來到2018年8月莺褒,盡管沒有獎金但是參與者眾多暖侨,而且?guī)缀跆焯於加懈隆D壳耙呀?jīng)有1.4萬人次參與此比賽或渤。其成績也實(shí)時向大眾公開旷余。Kaggle在Public Leaderboard公布了排名靠前的參賽者稱呼绢记,名次,
成績蠢熄,提交次數(shù),上一次提交距今時間饥追。
這個比賽的名稱為:House Prices: Advanced Regression Techniques. 需要預(yù)測房屋銷售價格并且練習(xí)特征工程和熟悉隨機(jī)森林Random Forests,Gradient Boosting Regressor等捏顺。由于有導(dǎo)師輔導(dǎo),是Kaggle比賽入門的極好的練手項(xiàng)目拆座。
此比賽項(xiàng)目的數(shù)據(jù)集有79個特征變量描述了美國衣阿華州AMES地區(qū)數(shù)年來的居住房屋銷售铐达。比賽的目標(biāo)是挑戰(zhàn)參賽者預(yù)測房屋的銷售價格。參賽者提交的報(bào)告評分是基于RMSE做出的(ROOT-MEAN-SQUARED-ERROR). 其計(jì)算公式為
(Pi 為預(yù)測第i個房屋的銷售價格;Oi為第i個房屋的實(shí)際銷售價格,n為樣本數(shù)翁垂。注意枚荣,此次的銷售價格數(shù)據(jù)進(jìn)行了取對數(shù)處理,這樣價格高和價格低對偏差的影響就相同了)
來啼肩,讓我們一起看看這個最熱門常青樹——Kaggle機(jī)器學(xué)習(xí)比賽項(xiàng)目House Price回歸分析的比賽戰(zhàn)況分析吧橄妆。我們用Python語言分析了最新的的公開得分排名,讀者可以在Kaggle官網(wǎng)下載原始數(shù)據(jù)祈坠。
希望本分析可以為在機(jī)器學(xué)習(xí)害碾,數(shù)據(jù)分析的道路上探索、實(shí)踐的你提供啟發(fā)赦拘!“熟能生巧”Honing your skills.
接下來慌随,還會有一系列進(jìn)一步的挖掘和分析!