1、DIN
1.1 動(dòng)機(jī):
(1)用戶的興趣是多樣的份企,傳統(tǒng)模型用固定長(zhǎng)度的用戶興趣表征向量限制了模型的表達(dá)能力也榄,很難準(zhǔn)確刻畫(huà)用戶興趣的多樣性。
(2)對(duì)待預(yù)測(cè)item司志,用戶不同的歷史行為和當(dāng)前要預(yù)測(cè)的item的相關(guān)性是不一樣的甜紫,無(wú)差別的特征交叉加權(quán)的方式是不合理的。
1.2 解決方案:
設(shè)計(jì)基于注意力機(jī)制的局部激活單元:利用用戶的歷史行為數(shù)據(jù)骂远,自適應(yīng)地學(xué)習(xí)與當(dāng)前item相關(guān)的用戶興趣表征向量囚霸,極大地提高模型(DIN)的表達(dá)能力,也更好地捕捉用戶興趣的多樣性激才。
即:將傳統(tǒng)的多值特征做pooling(sum_pooling/avg_pooling)的方式改成基于注意力的特征加權(quán)拓型,權(quán)重由當(dāng)前item和用戶行為的相關(guān)性決定的。
1.3 其他貢獻(xiàn):
(1)mini-batch aware正則化瘸恼。
(2)基于數(shù)據(jù)自適應(yīng)的激活函數(shù)Dice代替PReLU劣挫。
(3)模型評(píng)估指標(biāo)GAUC(用戶加權(quán)AUC)代替AUC。
1.4 模型結(jié)構(gòu)圖:
DIN.jpg
參考文獻(xiàn):