LR | Logic Regression | 邏輯回歸
Y = ax1 + bx2 + cx3 + dx4 ...
- 針對(duì)召回算法返回的數(shù)據(jù),進(jìn)行二次精排钉答,可以看做是對(duì)點(diǎn)擊率的預(yù)估数尿;
- x1,x2诊杆,... 可以理解成特征值,比如用戶(hù)的年齡豹储,用戶(hù)的性別淘这,門(mén)店的類(lèi)別铝穷,門(mén)店的價(jià)格等;
- a曙聂,b,... 是每個(gè)特征值的權(quán)重断国;
- Y 介于 0 和 1 之間稳衬,越接近 1语稠,越可能被點(diǎn)中了弄砍,越趨近 0音婶,被點(diǎn)擊的概率就越小寸士;
- 對(duì)于學(xué)習(xí)也是一樣碴卧,對(duì)于已經(jīng)存在的數(shù)據(jù),x1, x2, ... 已經(jīng)存在了婶博,并且 Y 是固定的,要么是被點(diǎn)擊的正樣本荧飞,要么是沒(méi)被點(diǎn)擊的負(fù)樣本凡人,有了正負(fù)樣本之后名党,就可以做邏輯回歸,算出 a, b, c, d挠轴,得出擬合公式传睹,就是一條直線;在線之上的就是正樣本(被點(diǎn)擊的)岸晦,在線之下就是負(fù)樣本(沒(méi)被點(diǎn)擊的)欧啤;
- 在做模型預(yù)測(cè)的時(shí)候,對(duì)于新進(jìn)來(lái)的點(diǎn)(一個(gè)門(mén)店)启上,將其 x 值輸入進(jìn)去堂油,然后判斷點(diǎn)是在直線的上方碧绞,還是線的下方府框,如果在線的下方,就可以認(rèn)為這個(gè)門(mén)店不被點(diǎn)擊讥邻,其排序的權(quán)重就比較小迫靖,如果在線的上方,Y 的值就會(huì)比較大兴使,比如 0.99系宜,其排序的權(quán)重就更靠前;