- 處理彩色圖像時(shí)告希,對(duì)所有點(diǎn)減去局部平均色忍坷,降低光照的影響
Kaggle做了一個(gè)Scripts板塊涯呻,可以不用搭建本地環(huán)境也不用下載數(shù)據(jù)狼讨,就可以寫代碼Run模型,目前提供三種語(yǔ)言R/RMarkdown/Python进苍。Kaggle Scripts
今日頭條的公司叫字節(jié)跳動(dòng)加缘,Bytedance。
XGBoost再三出現(xiàn)在Kaggle的獲獎(jiǎng)?wù)咴L談中觉啊。
TF-IDF,一下來(lái)自百度百科:TFIDF的主要思想是:如果某個(gè)詞或短語(yǔ)在一篇文章中出現(xiàn)的頻率TF高,并且在其他文章中很少出現(xiàn)沈贝,則認(rèn)為此詞或者短語(yǔ)具有很好的類別區(qū)分能力杠人,適合用來(lái)分類。
Feature Engineering似乎很重要宋下。
一些想法
Data Science很深嗡善,是整個(gè)industry的挺細(xì)的一個(gè)部分。我覺(jué)得我的興趣不在做深学歧,而是什么都玩一點(diǎn)罩引,感受人類發(fā)展的前沿或者次前沿,這樣當(dāng)未來(lái)降臨時(shí)我已經(jīng)準(zhǔn)備好了枝笨。
在一段時(shí)間內(nèi)不要自己去寫算法袁铐,多了解和使用已有的包揭蜒。