推薦系統(tǒng)是如何解決冷啟動(dòng)問(wèn)題深纲?共有6種主流方法仲锄!

亞馬遜CEO Jeff Bezos在早年間曾說(shuō)過(guò),他的夢(mèng)想是“如果我有100萬(wàn)個(gè)用戶湃鹊,我就要為他們做100萬(wàn)個(gè)亞馬遜網(wǎng)站”儒喊。而今天,隨著網(wǎng)絡(luò)的迅速發(fā)展币呵,用戶的數(shù)量和信息的數(shù)據(jù)早已超出百萬(wàn)的級(jí)別怀愧,使得用戶在面對(duì)大量信息時(shí)無(wú)法從中獲得對(duì)自己真正有用的部分。

解決信息超載問(wèn)題一個(gè)非常有潛力的辦法就是推薦系統(tǒng)富雅。提到推薦系統(tǒng)掸驱,大家肯定會(huì)想到淘寶、抖音没佑、網(wǎng)易云等互聯(lián)網(wǎng)公司毕贼,他們通過(guò)用戶的信息就能給用戶提供個(gè)性化推薦系統(tǒng)。一個(gè)好的推薦系統(tǒng)不僅能為用戶提供個(gè)性化的服務(wù)蛤奢,還能和用戶之間建立密切關(guān)系鬼癣,讓用戶對(duì)推薦產(chǎn)生依賴。

可是在推薦系統(tǒng)建立初期啤贩,如何在沒(méi)有大量用戶數(shù)據(jù)的情況下待秃,設(shè)計(jì)個(gè)性化推薦系統(tǒng)并且讓用戶對(duì)推薦結(jié)果滿意?或者系統(tǒng)中新添加的商品痹屹,該推薦給哪些潛在用戶章郁?這就是冷啟動(dòng)問(wèn)題。還好在《推薦系統(tǒng)實(shí)踐》中有針對(duì)不同種類的冷啟動(dòng)問(wèn)題的解決方法志衍,讓我結(jié)合書中的例子和目前主流的方法暖庄,給大家分享一下。


冷啟動(dòng)問(wèn)題介紹

冷啟動(dòng)問(wèn)題(cold start)主要分為3類楼肪。

  1. 用戶冷啟動(dòng)
    用戶冷啟動(dòng)主要解決如何給新用戶做個(gè)性化推薦的問(wèn)題培廓。當(dāng)新用戶到來(lái)時(shí),我們沒(méi)有他的行為數(shù)據(jù)春叫,所以也無(wú)法根據(jù)他的歷史行為預(yù)測(cè)其興趣肩钠,從而無(wú)法借此給他做個(gè)性化推薦泣港。
  2. 物品冷啟動(dòng)
    物品冷啟動(dòng)主要解決如何將新的物品推薦給可能對(duì)它感興趣的用戶這一問(wèn)題。
  3. 系統(tǒng)冷啟動(dòng)
    系統(tǒng)冷啟動(dòng)主要解決如何在一個(gè)新開發(fā)的網(wǎng)站上(還沒(méi)有用戶价匠,也沒(méi)有用戶行為当纱,只有一些物品的信息)設(shè)計(jì)個(gè)性化推薦系統(tǒng),從而在網(wǎng)站剛發(fā)布時(shí)就讓用戶體驗(yàn)到個(gè)性化推薦服務(wù)這一問(wèn)題

對(duì)于這3中不同的冷啟動(dòng)問(wèn)題霞怀,有不同的解決方案惫东。一般來(lái)說(shuō),可以參考如下解決方案毙石。

1. 提供非個(gè)性化的推薦

最簡(jiǎn)單的例子就是熱門排行榜廉沮,我們可以給用戶推薦熱門排行榜,然后等到用戶數(shù)據(jù)收集到一定的時(shí)候徐矩,再切換為個(gè)性化推薦滞时。


知乎熱榜

2. 利用用戶注冊(cè)信息

用戶注冊(cè)時(shí)提供包括用戶的年齡、性別滤灯、職業(yè)坪稽、民族、學(xué)歷和居住地等數(shù)據(jù)鳞骤,做粗粒度的個(gè)性化窒百。有一些網(wǎng)站還會(huì)讓用戶用文字描述他們的興趣。
基于注冊(cè)信息的個(gè)性化推薦流程基本如下:

(1) 獲取用戶的注冊(cè)信息豫尽;
(2)根據(jù)用戶的注冊(cè)信息對(duì)用戶分類篙梢;
(3)給用戶推薦他所屬分類中用戶喜歡的物品。

3. 利用社交網(wǎng)絡(luò)信息

引導(dǎo)用戶通過(guò)社交網(wǎng)絡(luò)賬號(hào)登錄(需要用戶授權(quán))美旧,導(dǎo)入用戶在社交網(wǎng)站上的好友信息渤滞,然后給用戶推薦其好友喜歡的物品。


4. 利用用戶反饋信息

要求用戶在登錄時(shí)對(duì)一些物品進(jìn)行反饋榴嗅,收集用戶對(duì)這些物品的興趣信息妄呕,然后給用戶推薦那些和這些物品相似的物品。


5. 利用物品的內(nèi)容信息

物品冷啟動(dòng)需要解決的問(wèn)題是如何將新加入的物品推薦給對(duì)它感興趣的用戶嗽测。
物品冷啟動(dòng)在新聞網(wǎng)站等時(shí)效性很強(qiáng)的網(wǎng)站的推薦非常重要绪励,因?yàn)槟切┚W(wǎng)站中時(shí)時(shí)刻刻都有新加入的物品,而且每個(gè)物品必須能夠在第一時(shí)間展現(xiàn)給用戶唠粥,否則經(jīng)過(guò)一段時(shí)間后优炬,物品的價(jià)值就大大降低了。
利用物品的內(nèi)容信息厅贪,將新物品先投放給曾經(jīng)喜歡過(guò)和它內(nèi)容相似的其他物品的用戶,解決了如何將新加入的物品推薦給對(duì)它感興趣的用戶的問(wèn)題雅宾。不過(guò)當(dāng)新物品加入時(shí)养涮,內(nèi)存中的物品相關(guān)表中不會(huì)存在這個(gè)物品葵硕,從而無(wú)法推薦新的物品。解決這一問(wèn)題的辦法是頻繁更新物品相似度表贯吓。

常見(jiàn)物品 內(nèi)容信息
圖書 標(biāo)題懈凹、作者、出版社悄谐、出版年代介评、叢書名、目錄爬舰、正文
電影 標(biāo)題们陆、導(dǎo)演、演員情屹、編劇坪仇、類別、劇情簡(jiǎn)介垃你、發(fā)行公司
新聞 標(biāo)題椅文、正文、來(lái)源惜颇、作者
微博 作者皆刺、內(nèi)容、評(píng)論

6. 發(fā)揮專家的作用

很多推薦系統(tǒng)在建立時(shí)凌摄,既沒(méi)有用戶的行為數(shù)據(jù)羡蛾,也沒(méi)有充足的物品內(nèi)容信息來(lái)計(jì)算準(zhǔn)確的物品相似度。那么望伦,為例在推薦系統(tǒng)建立時(shí)就讓用戶得到比較好的體驗(yàn)林说,很多推薦系統(tǒng)都利用專家進(jìn)行標(biāo)注。

其他冷啟動(dòng)策略

除了之前提到的6種方法以為屯伞,還有諸多能夠幫助我們完成推薦系統(tǒng)冷啟動(dòng)的機(jī)器學(xué)習(xí)利器腿箩,主要包括主動(dòng)學(xué)習(xí)、遷移學(xué)習(xí)劣摇、“探索與利用”機(jī)制珠移。它們解決冷啟動(dòng)問(wèn)題的機(jī)制各不相同,以下簡(jiǎn)述它們解決問(wèn)題的主要思路末融。

  1. 主動(dòng)學(xué)習(xí)
    主動(dòng)學(xué)習(xí)的過(guò)程完全遵循“行動(dòng)-反饋-狀態(tài)更新”的強(qiáng)化學(xué)習(xí)循環(huán)钧惧。它的學(xué)習(xí)目的就是在一次又一次的循環(huán)迭代種,讓推薦系統(tǒng)盡量快速地度過(guò)冷啟動(dòng)狀態(tài)勾习,為用戶提供個(gè)性化地推薦結(jié)果浓瞪。
  2. 遷移學(xué)習(xí)
    遷移學(xué)習(xí)就是在某領(lǐng)域知識(shí)不足地情況下,遷移其他領(lǐng)域地?cái)?shù)據(jù)或知識(shí)巧婶,用于本領(lǐng)域地學(xué)習(xí)乾颁。將其他領(lǐng)域地知識(shí)用于當(dāng)前領(lǐng)域地推薦涂乌,那么冷啟動(dòng)問(wèn)題自然迎刃而解。
  3. “探索與利用”機(jī)制
    探索與利用是在“探索新數(shù)據(jù)”和“利用舊數(shù)據(jù)”之間地平衡英岭,使系統(tǒng)既能利用舊數(shù)據(jù)進(jìn)行推薦湾盒,達(dá)到推薦系統(tǒng)地商業(yè)目標(biāo),又能高效地探索冷啟動(dòng)的物品是否是“優(yōu)質(zhì)”物品诅妹,使冷啟動(dòng)物品獲得曝光的傾向罚勾,快速收集冷啟動(dòng)數(shù)據(jù)。

以上就是我看完這本書之后吭狡,對(duì)推薦系統(tǒng)冷啟動(dòng)問(wèn)題的大致總結(jié)尖殃。如果大家也想入門推薦系統(tǒng),了解個(gè)性化推薦的秘密赵刑,不妨來(lái)讀讀這本書分衫。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市般此,隨后出現(xiàn)的幾起案子蚪战,更是在濱河造成了極大的恐慌,老刑警劉巖铐懊,帶你破解...
    沈念sama閱讀 211,042評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件邀桑,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡科乎,警方通過(guò)查閱死者的電腦和手機(jī)壁畸,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)茅茂,“玉大人捏萍,你說(shuō)我怎么就攤上這事】障校” “怎么了令杈?”我有些...
    開封第一講書人閱讀 156,674評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)碴倾。 經(jīng)常有香客問(wèn)我逗噩,道長(zhǎng),這世上最難降的妖魔是什么跌榔? 我笑而不...
    開封第一講書人閱讀 56,340評(píng)論 1 283
  • 正文 為了忘掉前任异雁,我火速辦了婚禮,結(jié)果婚禮上僧须,老公的妹妹穿的比我還像新娘纲刀。我一直安慰自己,他們只是感情好担平,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評(píng)論 5 384
  • 文/花漫 我一把揭開白布示绊。 她就那樣靜靜地躺著芥挣,像睡著了一般。 火紅的嫁衣襯著肌膚如雪耻台。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,749評(píng)論 1 289
  • 那天空另,我揣著相機(jī)與錄音盆耽,去河邊找鬼。 笑死扼菠,一個(gè)胖子當(dāng)著我的面吹牛摄杂,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播循榆,決...
    沈念sama閱讀 38,902評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼析恢,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了秧饮?” 一聲冷哼從身側(cè)響起映挂,我...
    開封第一講書人閱讀 37,662評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎盗尸,沒(méi)想到半個(gè)月后柑船,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,110評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡泼各,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年鞍时,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片扣蜻。...
    茶點(diǎn)故事閱讀 38,577評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡逆巍,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出莽使,到底是詐尸還是另有隱情锐极,我是刑警寧澤,帶...
    沈念sama閱讀 34,258評(píng)論 4 328
  • 正文 年R本政府宣布吮旅,位于F島的核電站溪烤,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏庇勃。R本人自食惡果不足惜檬嘀,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望责嚷。 院中可真熱鬧鸳兽,春花似錦、人聲如沸罕拂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至衷掷,卻和暖如春辱姨,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背戚嗅。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工雨涛, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人懦胞。 一個(gè)月前我還...
    沈念sama閱讀 46,271評(píng)論 2 360
  • 正文 我出身青樓替久,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親躏尉。 傳聞我的和親對(duì)象是個(gè)殘疾皇子蚯根,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容