今日頭條的推薦算法
(原鏈接https://36kr.com/p/5114077)
待解決的問題:資訊危号、用戶和環(huán)境之間的匹配關(guān)系雀费,擬合用戶對內(nèi)容滿意度的函數(shù)牙寞。
內(nèi)容有很多特征免钻,如何提取才能做好推薦,是需要仔細(xì)考慮的汗侵。
用戶特征幸缕,包括興趣、職業(yè)晃择、年齡等冀值,還有許多可以刻畫用戶隱藏的興趣。
環(huán)境特征宫屠,用戶可以在不同場景、在工作滑蚯、交通浪蹂、旅游等場景下抵栈,信息偏好是不同的。
模型依據(jù)上述特征會給出預(yù)估坤次,推測所推薦的內(nèi)容在此場景下是否適合用戶古劲。
那些無法直接衡量的目標(biāo)怎么辦?
比如說廣告和特型內(nèi)容頻控缰猴。問答型的內(nèi)容推薦产艾,目標(biāo)不光是讓用戶瀏覽,還包括吸引用戶貢獻(xiàn)內(nèi)容滑绒。這些內(nèi)容如何混排闷堡,控制頻率等都需要考慮。
還有疑故,平臺為了生態(tài)以及社會責(zé)任感杠览,需要打擊低俗內(nèi)容、降權(quán)等纵势。這些算法無法完成踱阿,需要進(jìn)一步干預(yù)。
典型的推薦特征钦铁。
相關(guān)性软舌,即評估內(nèi)容和用戶是否匹配。環(huán)境特征牛曹,包括地理位置佛点、時間。熱度特征躏仇,全局熱度恋脚、分類熱度等。協(xié)同特征焰手,通過用戶行為分析不同用戶建的相似性糟描。