前言
最近轉(zhuǎn)到了其他部門做項(xiàng)目管理,剛來前幾天是真的忙注服。今晚有點(diǎn)閑韭邓,前幾天看了公司內(nèi)部同事分享的個(gè)性化推薦系統(tǒng)的文章,自己做一個(gè)總結(jié)并發(fā)散下思維溶弟,分享給大家女淑。
概念
我覺得我們可以從拆詞游戲玩起來。個(gè)性化推薦系統(tǒng)辜御,可以從“個(gè)性化”鸭你,“推薦”,“系統(tǒng)”來聊我抠。
“個(gè)性化”是目的苇本;“推薦”是手段;“系統(tǒng)”則是技術(shù)核心菜拓;
“個(gè)性化”就是向每個(gè)用戶提供定制的符合其興趣偏好的物品瓣窄,從而達(dá)到千人千面的效果。舉個(gè)簡(jiǎn)單的例子纳鼎,大家都知道的抖音俺夕,筆者本身就是一個(gè)抖音重度使用者,每天上班沒時(shí)間刷贱鄙,那么上下班路上和晚上睡覺前都會(huì)忍不住去刷抖音劝贸。有時(shí)候我會(huì)問自己,“為什么會(huì)上癮逗宁?”最終得到的核心答案是“抖音了解我映九,甚至比我自己更了解我!”瞎颗。了解我到什么程度呢件甥,也就是我不會(huì)讓別人玩我的抖音捌议,因?yàn)樗麜?huì)知道我的興趣愛好是什么,抖音會(huì)暴露我的內(nèi)在心理活動(dòng)引有。
主動(dòng)讓網(wǎng)易云音樂了解我瓣颅。在舉個(gè)網(wǎng)易云音樂的例子,網(wǎng)易云音樂我用的最多的音樂播放器了譬正,雖然很多音樂的版權(quán)它都沒有宫补,但是它的個(gè)性化推薦系統(tǒng)還是可以學(xué)習(xí)的。
上面是我自己的“每日推薦”和“我喜歡的音樂”的界面曾我。我每天都會(huì)打開“每日推薦”粉怕,然后一首一首的聽里面的歌,好聽的我就點(diǎn)擊“喜歡”并且瘋狂循環(huán)播放抒巢,不喜歡的我就點(diǎn)擊“不感興趣”斋荞。一段時(shí)間后,我會(huì)發(fā)現(xiàn)“每日推薦”里的歌曲都是我喜愛的虐秦,有一種在訓(xùn)練產(chǎn)品的感覺。
“推薦”是一個(gè)過程凤优。為什么要推薦悦陋,因?yàn)槠鋵?shí)在很多時(shí)候,用戶對(duì)于自己的需求也是不明確的筑辨,依舊拿網(wǎng)易云音樂來說俺驶,用戶在需要聽歌時(shí)打開播放器,但是對(duì)于具體想聽什么類型歌曲棍辕,搖滾還是民謠暮现?還是純音樂?或者單純的最近網(wǎng)紅歌曲楚昭?用戶的需求是模糊的栖袋,這時(shí)候他就需要一個(gè)被動(dòng)的被推薦過程,這也是“每日推薦”解決的痛點(diǎn)之一抚太。像搜索這類有目的性的操作往往是用戶主動(dòng)型的塘幅,這與推薦正好相反。
“系統(tǒng)”尿贫,既然被稱為“系統(tǒng)”电媳,說明這是一套由多個(gè)功能模塊組成的整體。各個(gè)模塊之間相互影響庆亡,最終把個(gè)性化信息推薦給用戶匾乓。這里面涉及到很多模塊,比如用戶行為數(shù)據(jù)又谋,內(nèi)容信息的屬性數(shù)據(jù)拼缝,物品屬性娱局,還有就是推薦系統(tǒng)的核心算法引擎。
個(gè)性化推薦系統(tǒng)的優(yōu)勢(shì)
在早期的推薦珍促,往往是簡(jiǎn)單的物品分發(fā)機(jī)制铃辖,舉個(gè)栗子,我在使用一款直播APP時(shí)猪叙,我分別安裝兩次娇斩,在安裝時(shí)分別把性別設(shè)置成男和女,但是推薦的內(nèi)容卻是一模一樣的穴翩。蛋疼犬第,難道對(duì)于直播內(nèi)容,男女的喜好都是一樣的嗎芒帕?雖說是冷啟動(dòng)時(shí)期歉嗓,但是對(duì)于性別這樣重要的屬性是否考慮推薦不同內(nèi)容?再說現(xiàn)在的內(nèi)容類產(chǎn)品背蟆,特別是目前流行的短視頻應(yīng)用鉴分,新聞?lì)悜?yīng)用,可以說是信息負(fù)載带膀,那么對(duì)于這些海量信息志珍,如何讓用戶快速找到自己感興趣的產(chǎn)品,這時(shí)候個(gè)性化推薦就派上了很大的用處垛叨,舉例“今日頭條”伦糯。而且在內(nèi)容類產(chǎn)品還有一個(gè)問題就是存在馬太效應(yīng),就是熱門的信息越來越熱門嗽元,冷門的信息越來越冷門敛纲,那么數(shù)量巨大的長(zhǎng)尾信息如何曝光呢?個(gè)性化推薦系統(tǒng)也是一個(gè)比較好的解決方案剂癌。
業(yè)務(wù)數(shù)據(jù)獲取
說了那么多淤翔,那么個(gè)性化推薦系統(tǒng)畢竟是要有一個(gè)最重要的影響因素,就是有用數(shù)據(jù)珍手“煺。“系統(tǒng)”的成功落地是基于優(yōu)質(zhì)算法和有用數(shù)據(jù)的結(jié)合。那么具體有哪些數(shù)據(jù)呢琳要?
能反應(yīng)用戶興趣愛好的數(shù)據(jù)寡具,最簡(jiǎn)單的就是讓用戶填興趣愛好信息等
物品屬性,例如資訊類的標(biāo)題稚补,作者童叠,正文內(nèi)容,發(fā)布時(shí)間等
用戶屬性,性別厦坛,職業(yè)五垮,年齡,地址杜秸,單身情況放仗,學(xué)歷,收入等
用戶行為數(shù)據(jù)撬碟,點(diǎn)擊诞挨,瀏覽時(shí)間,點(diǎn)贊呢蛤,收藏惶傻,評(píng)論,轉(zhuǎn)發(fā)
基于社交網(wǎng)絡(luò)的數(shù)據(jù)其障,比如獲取用戶通訊錄信息银室,微博登錄時(shí)獲取微博關(guān)系網(wǎng)絡(luò)信息。我到現(xiàn)在還沒到明白抖音的社交數(shù)據(jù)從哪里來的励翼,我小姨和我沒有通話記錄蜈敢,通訊錄沒有她號(hào)碼,我抖音也沒有給她關(guān)注汽抚,點(diǎn)贊等任何操作扶认,但是經(jīng)常推送我小姨的視頻(可能認(rèn)識(shí)的人)。我只有我小姨微信號(hào)殊橙,但是我沒有用微信在抖音上的任何操作,退一步說抖音和微信在撕逼也不可能把社交信息給抖音狱从。要是有小伙伴知道還希望可以解惑
基于上下文的數(shù)據(jù)膨蛮,這里又分時(shí)間上下文和地點(diǎn)上下文。時(shí)間上下文季研,舉個(gè)栗子敞葛,某外賣APP會(huì)根據(jù)早中晚用戶點(diǎn)外賣類型來推送不同的食物,比如早上推送粥与涡,中午推送米飯?zhí)撞腿切常砩贤扑托〕裕坏攸c(diǎn)上下文驼卖,比如推送給你周圍的餐廳氨肌,而不是很遠(yuǎn)的餐廳
用戶消費(fèi)水平數(shù)據(jù),其實(shí)這可以放在用戶屬性里酌畜,但是我覺得比較重要就拿出來單獨(dú)一點(diǎn)怎囚。對(duì)于消費(fèi)型平臺(tái)APP尤其要關(guān)注用戶消費(fèi)水平。舉個(gè)栗子桥胞,前段時(shí)間某消費(fèi)APP被爆出同一家酒店恳守,同一間房考婴,同一時(shí)間點(diǎn)入住,兩個(gè)用戶的價(jià)格不一樣催烘,相差在幾十元沥阱。這說明什么?這個(gè)APP在根據(jù)你的消費(fèi)水平實(shí)時(shí)改變物品單價(jià)伊群。對(duì)于這種行為考杉,的確在產(chǎn)品運(yùn)營(yíng)上可以說是創(chuàng)新,但是對(duì)于用戶而言在岂,一旦發(fā)現(xiàn)自己支付單價(jià)高于別人奔则,那么那種不平衡的心理會(huì)讓他覺得你的產(chǎn)品是騙子,最終遠(yuǎn)離你的產(chǎn)品蔽午。所以產(chǎn)品的“三觀”我們還是要正視一下的易茬。
ps:希望可以和大家一起學(xué)習(xí)進(jìn)步。wx:LTJhandsome