![240](https://upload.jianshu.io/users/upload_avatars/1676597/a7c9f3b6-98d8-497f-b6ca-6131318057b8.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
IP屬地:黑龍江
1,前言 很久不發(fā)文章徽级,整理些干貨,希望相互學(xué)習(xí)吧构舟。進(jìn)入主題灰追,本文主要時說的為樸素貝葉斯分類算法。與邏輯回歸狗超,決策樹一樣弹澎,是較為廣泛使用的有監(jiān)督...
剛好最近經(jīng)常看一些word2vec的文章努咐,在最后往往看到作者說用t-SNE可視化結(jié)果苦蒿,也即把高維度的數(shù)據(jù)降維并可視化。很奇怪作者為何不用PCA或...
Elasticsearch一般首要解決的問題: 首先是中文分詞(目前默認(rèn)是IK渗稍,建議看下是否有沒其他更好的方案或可優(yōu)化得點) 其次相關(guān)性(搜索關(guān)...
由于語料缺乏佩迟,前期若使用到情感分析,建議暫時使用SnowNLP(此模塊主要使用淘寶評論語料)做情感挖掘竿屹,但不僅僅為單純調(diào)用报强,需要優(yōu)化,下面是一些...
搜狗新聞與清華新聞文章都是偏新聞類別拱燃,若要商品類別文本秉溉,則需要爬取,代碼如下,參考https://www.cnblogs.com/sirkevi...
Gradient boosting is one of the most powerful techniques for building pr...
目前我們的推薦算法單一且標(biāo)簽質(zhì)量一般,隨著業(yè)務(wù)量的增加需要使用多推薦算法融合: 1)生成推薦商品候選集算法選擇: 度算法融合的選型:**基于標(biāo)簽...