1记劈,TF?IDF算法 TF是指歸一化后的詞頻绑青,IDF是指逆文檔頻率进陡。給定一個文檔集合D,有d1,d2,d3,......,dn∈D舌狗。文檔集合總共...
搜索意圖識別: Query分析: 分詞:切詞鲁驶,pinyin分詞 查詢類目預測: Query改寫: Query改寫本質上是要找到和原始Query相...
在搜索過程中,需要使用同義詞來達到提高召回的目的赎线,例如用戶搜索:口紅廷没,但是商品名稱卻不含口紅關鍵詞,比如商品名為:xxx彩色唇膏垂寥。但其實兩個詞是...
從最開始的邏輯回歸到后來的CNN颠黎,RNN另锋,我們經(jīng)常會聽到激活函數(shù)這個詞,也經(jīng)常會聽到sigmod函數(shù)會造成神經(jīng)網(wǎng)絡梯度消失狭归,BN為什么能緩解梯度...
在模型的評估與調(diào)整的過程中夭坪,經(jīng)常會遇到過擬合與欠擬合的情況,如何有效的識別過擬合和欠擬合現(xiàn)象过椎,并了解其中原因室梅,有效的對模型進行調(diào)整。 什么是過擬...
最近朋友面試有被問到文本聚類問題疚宇,總結如下: 聚類分析亡鼠,又稱群分析,它是研究(樣品或指標)分類問題的一種統(tǒng)計分析方法敷待,以相似性為基礎拆宛,在一個聚類...
1.RNN解決了什么問題讼撒? RNN主要用來解決序列問題浑厚,強調(diào)的是先后順序,在NLP中引申出上下文的概念根盒,一個翻譯問題钳幅,這個詞的含義可能和前后的單...
Xgboost無論是工業(yè)界還是kaggle比賽效果都很好,學習過程中看了很多博客依然理解的不是很好炎滞,自己比較菜敢艰,看了陳天奇大神PPT清晰了很多,...
最近被問到熱詞挖掘册赛,幾種挖掘場景用到的算法思路都比較接近钠导,特整理思路如下,做以后參考森瘪。 幾個熱詞挖掘常見場景: 搜索query熱詞挖掘 輿情長文...