在這個極度信息爆炸的時代搔啊,人們有了更為廣闊的信息獲取渠道,但是卻發(fā)現(xiàn)要獲取到實際感興趣的內(nèi)容越來越困難丽已。傳統(tǒng)的搜索引擎已經(jīng)滿足不了用戶高效獲取信息的需求廓块。推薦機制成長迅速厢绝,與搜索一起,成為了用戶獲取信息的最主要的方式之一带猴。
我最近在做幾個與推薦有關(guān)的項目昔汉,工作需要,關(guān)于推薦機制也現(xiàn)學了一些皮毛拴清,期待與你一起學習成長靶病。
推薦機制,簡單來說口予,就是依據(jù)一定的算法娄周,把內(nèi)容推薦給可能對它感興趣的用戶的一種技術(shù),這里的「內(nèi)容」可以是文章沪停,可以是商品煤辨,可以是職位,可以是廣告木张,可以是視頻众辨,也可以是人。
先用一張導圖來概括整篇文章的內(nèi)容:
推薦機制要順利運轉(zhuǎn)舷礼,缺不了兩個東西鹃彻,一個是數(shù)據(jù)(內(nèi)容和用戶),一個是算法(規(guī)則)妻献。
先來說說數(shù)據(jù)蛛株。
推薦機制需要的數(shù)據(jù)包括內(nèi)容和用戶团赁。但內(nèi)容和用戶在實際情況下是相當復雜的,必須要將它們二者有價值的東西抽象出來谨履。對于推薦機制欢摄,通過「標簽」來了解內(nèi)容,通過「屬性和行為」來認識用戶屉符。內(nèi)容詳盡的標簽數(shù)據(jù)剧浸,用戶詳實的屬性數(shù)據(jù)和豐富的行為數(shù)據(jù)锹引,是推薦機制運作的基礎矗钟。
再來說說算法。
比較基本的推薦算法有三種:基于內(nèi)容的推薦算法嫌变,基于用戶屬性的推薦算法和協(xié)同過濾推薦算法吨艇。
1.基于內(nèi)容的推薦算法
這種算法是根據(jù)內(nèi)容的標簽,比如主題啦腾啥,類型啦东涡,關(guān)鍵詞啦等等,將標簽相似的內(nèi)容歸為一類倘待,把這類內(nèi)容推薦給可能有偏好(瀏覽過疮跑,收藏過,點過贊凸舵,購買過祖娘,評價過等)的用戶。
以新聞資訊類產(chǎn)品為例啊奄,畫個圖如下方便理解:
用戶小紅經(jīng)常瀏覽有關(guān)娛樂明星的新聞渐苏,小明經(jīng)常看體育比賽新聞菇夸,那就把最新的娛樂八卦新聞推薦給小紅琼富,把體育類最新資訊推薦給小明。
2.基于用戶屬性的推薦算法
這種算法根據(jù)用戶的屬性庄新,比如性別啦鞠眉,年齡啦,所在城市啦等等择诈,將屬性相似的用戶歸為一類械蹋,給這類用戶推薦相同的內(nèi)容。
以視頻類產(chǎn)品為例吭从,畫個圖方便理解:
24 歲的姑娘小紅看了《瘋狂動物城》并給了好評朝蜘,27 歲的小伙小明看了《荒野獵人》給了好評,那就可以把《瘋狂動物城》推薦給 23 歲的女性小花涩金,把 《荒野獵人》推薦給 30 歲的男性小剛谱醇。
3.協(xié)同過濾推薦算法
根據(jù)重點關(guān)注的數(shù)據(jù)不同暇仲,這種算法一般分為基于用戶的協(xié)同過濾算法和基于內(nèi)容的協(xié)同過濾算法。
基于用戶的協(xié)同過濾算法:根據(jù)用戶的歷史行為偏好副渴,把具有相同偏好的用戶歸為一類用戶群奈附,把這個用戶群中一些用戶喜歡的內(nèi)容推薦給這個群體中的其他用戶
以電商類產(chǎn)品為例,畫個圖方便理解:
小紅的購物車里收藏了好多件連帽套頭衛(wèi)衣煮剧,印花棒球服和韓版寬松毛衣斥滤,小花近期也收藏了好多件連帽衛(wèi)衣和印花棒球服,鑒于小紅和小花都喜歡連帽衛(wèi)衣和印花棒球服勉盅,她們可能擁有相同的偏好佑颇,那可以把小紅喜歡的韓版寬松毛衣也推薦給小花。
基于內(nèi)容的協(xié)同過濾算法:根據(jù)用戶的歷史行為偏好草娜,把多數(shù)用戶同時喜歡的內(nèi)容歸為一類內(nèi)容群挑胸,把這個內(nèi)容群中的一些內(nèi)容推薦給對這個內(nèi)容群中其他內(nèi)容感興趣的用戶。
以求職類產(chǎn)品為例宰闰,畫個圖方便理解:
小紅應聘了杭州某互聯(lián)網(wǎng)公司的行政崗位茬贵,小花和小明也應聘了該公司的行政崗同時還應聘了客服崗,通過小花和小明的偏好移袍,可以推測出這兩個崗位要求很相似解藻,那就把這家公司的客服崗也推薦給小紅。
推薦機制的算法有好多葡盗,這些只是一些比較基本的螟左,根據(jù)產(chǎn)品特性和業(yè)務場景的不同,要使用的推薦算法也不一樣戳粒,比如一些新上線的產(chǎn)品路狮,由于缺乏足夠的用戶屬性和行為數(shù)據(jù),只有內(nèi)容數(shù)據(jù)蔚约,會使用基于內(nèi)容的推薦算法; 一些 UGC 類社區(qū)的產(chǎn)品奄妨,由于內(nèi)容不可控,卻對用戶屬性和行為很了解苹祟,會使用基于用戶屬性的推薦算法或基于用戶的協(xié)同過濾算法砸抛;再比如招聘類產(chǎn)品,由于內(nèi)容(公司)的數(shù)量遠遠小于用戶(求職者)的數(shù)量树枫,對內(nèi)容的把控會更加穩(wěn)定和精準直焙,會使用基于內(nèi)容的協(xié)同過濾算法。
說了這么多砂轻,你有沒有一點點頭暈暈啊啊啊奔誓,來做個思考題,說不定會更暈的搔涝〕梗看下圖和措,微信使用了哪一種推薦算法?