豆瓣讀書推薦策略的階段性調(diào)研

調(diào)研豆瓣讀書的書籍詳情頁药薯,喜歡這本書的人也喜歡這個推薦模塊的效果见芹。

?

一. 理想態(tài)

1.1定義理想態(tài)

給用戶推薦相關(guān)且用戶潛在感興趣的書籍别智,吸引用戶進行深層次互動行為桩匪,包括點擊,評論邦泄,收藏等撬腾,提高用戶在平臺的留存枫甲。

1.2核心指標(biāo)拆解

(1)用戶基本行為分析

用戶對于【喜歡這本書的人也喜歡】推薦列表的操作如下所示椅亚。

用戶不點擊推薦書籍限番,表明用戶不滿足,不是用戶喜歡的呀舔;用戶點擊推薦書籍弥虐,但是存在跳出行為,表明用戶對于該推薦一般媚赖;而存在查看行為霜瘪,表明用戶對于推薦的書籍存在一定的興趣,較滿足惧磺;若用戶產(chǎn)生互動行為和購買行為粥庄,則認(rèn)為用戶被滿足,達(dá)到較為理想的推薦效果豺妓。

Ps:對于已登入用戶,假設(shè)推薦列表都是推薦給用戶沒有看過的書籍布讹,如果用戶后續(xù)操作標(biāo)記“在讀”琳拭,“讀過”等,表明用戶雖然看了此書但是并未在平臺上有過相應(yīng)的操作描验,平臺并未識別到白嘁,那么后續(xù)推薦便可不再推薦;但是此次推薦膘流,用戶產(chǎn)生了互動行為所以依然可以被認(rèn)為得到滿足絮缅,因為符合理想態(tài)的定義。

(2)核心指標(biāo)量化

一般來說推薦系統(tǒng)理想態(tài)的衡量指標(biāo)是準(zhǔn)確率和召回率呼股。準(zhǔn)確率是針對我們預(yù)測結(jié)果而言的耕魄,它表示的是預(yù)測為正的樣本中有多少是真正的正樣本。而召回率是針對我們原來的樣本而言的彭谁,它表示的是樣本中的正例有多少被預(yù)測正確了吸奴。

因此本次設(shè)定指標(biāo)如下:

準(zhǔn)確率=每本推薦書籍的點擊uv /推薦列表的總點擊uv

例如我們給用戶推薦了10本書籍,對其中2本,用戶產(chǎn)生了點擊则奥,那么準(zhǔn)確率為2/10= 0.2考润。推薦列表準(zhǔn)確率=每本推薦書籍的求和平均值,可橫向?qū)Ρ人型扑]書籍的轉(zhuǎn)化情況读处,可以重點觀察過高或過低的異常值糊治。

召回率=用戶在推薦列表的點擊書籍?dāng)?shù)/用戶在平臺的總點擊書籍?dāng)?shù)

例如我們給用戶推薦了10本書籍,其中1本用戶產(chǎn)生了點擊罚舱,而用戶最終在平臺上總共點擊了20本數(shù)井辜,那么召回率為1 / 20 = 0.05, 表示的是推薦系統(tǒng)推薦的那些符合用戶興趣并產(chǎn)生點擊的書籍占了用戶實際總共點擊的書籍有多少比例馆匿。

推薦位置轉(zhuǎn)化率=第N個位置的點擊UV/推薦列表的總點擊UV

一般而言抑胎,越靠前位置的推薦書籍越該是用戶最感興趣,且與本書相關(guān)性高的渐北,因此用戶點擊的可能性越大阿逃,推薦位置轉(zhuǎn)化率越高;隨著位置靠后赃蛛,推薦轉(zhuǎn)化率下降恃锉;可以縱向比較,不同書籍的同位置的轉(zhuǎn)化率呕臂;可以橫向比較同一個推薦列表的不同位置的轉(zhuǎn)化率破托,一般而言推薦位置的轉(zhuǎn)化率。

用戶滿足程度=采用對應(yīng)路徑進入的uv/通過推薦進入書籍詳情頁的總uv

如上圖所示歧蒋,將用戶的交互行為路徑分類土砂,并進行量化。

二. 抽樣分析

由于數(shù)據(jù)獲取較難谜洽,因此采取抽樣調(diào)查的方法萝映,檢查核心指標(biāo)是否達(dá)到理想態(tài),從而探索豆瓣讀書的推薦策略及是否存在問題阐虚。

2.1分析維度及字段選擇

一般而言序臂,推薦策略的輸入主要有兩個特征,用戶特征和書籍特征实束,將用戶與書籍做匹配奥秆,但是調(diào)查發(fā)現(xiàn):

(1)選取的指標(biāo)需滿足符合常理同時可量化,數(shù)據(jù)可獲取的條件咸灿,用戶特征無法獲取构订。

(2)游客狀態(tài)和登錄狀態(tài),登錄與多次操作后避矢,該推薦模塊都沒有變化鲫咽,也佐證用戶特征沒有作為輸入签赃。

因此此次主要從書籍特征進行分析,標(biāo)記星號的為可用字段分尸。

2.2書籍選擇

書籍選擇如下锦聊,方便從不同維度進行分析。

2.3樣本分析

1.增長黑客

2.運營之光2.0

3.哈利波特與密室

4.截句詩叢冷門

5.聰明女人說話辦事108個細(xì)節(jié)

2.4推薦策略猜測

(1)推薦策略的基本情況

游客與會員對比:在退出登錄后箩绍,以游客身份重新搜索一遍相同的書籍孔庭,發(fā)現(xiàn)游客和會員看到的推薦書籍是一樣的,由此猜測:豆瓣讀書沒有按用戶類別做個性化推薦材蛛。

同身份多次操作對比:再次登錄圆到,在書籍詳情頁做了想讀、在讀卑吭、讀過芽淡、評價、取消在讀豆赏、取消讀過等交互操作挣菲,推薦列表的書籍沒有變化;點開推薦書籍詳情頁后掷邦,又返回原書籍詳情頁白胀,推薦列表的書籍依然沒有變化。

同身份隔天登入對比:發(fā)現(xiàn)該模塊的部分書籍進行了替換抚岗,位置也進行了調(diào)整或杠,如《增長黑客》替換了4本書,未被替換的6本位置也有所調(diào)整宣蔚,表明該模塊的推薦策略以天為單位進行重新推薦向抢。

(2)是否進行推薦

通過對冷門書籍進行比對,發(fā)現(xiàn)是否進行推薦與評分人數(shù)和評分高低密切相關(guān)胚委。

(3)推薦策略的關(guān)鍵輸入

對于評分人數(shù)10人以上挟鸠,評分6分以上的書籍進行推薦策略的猜測,根據(jù)抽樣的結(jié)果整理可知:按照樣本的情況篷扩,可知,比較書籍與對應(yīng)推薦書籍的情況茉盏,推薦策略的關(guān)鍵輸入根據(jù)相關(guān)性的優(yōu)先級確定鉴未,排序依次為豆列,標(biāo)簽鸠姨,評分铜秆,出版時間,出版公司等讶迁。

因此猜測對于評分人數(shù)10人以上连茧,評分6分以上的書籍,大概率根據(jù)豆列,標(biāo)簽啸驯,評分客扎,出版時間,出版公司等字段進行加權(quán)計算罚斗,得出候選內(nèi)容池并進行排序徙鱼,與本書籍相關(guān)性最高,得分最高的排在前面针姿。

三.問題匯總

3.1發(fā)現(xiàn)問題

(1)沒有考慮用戶類別和用戶行為做個性化推薦

(2)無評分或評分人數(shù)少袱吆,評分低的書籍無推薦模塊

(3)關(guān)鍵輸入“豆列”涵蓋性過廣----準(zhǔn)確性不夠,推薦不準(zhǔn)

《哈利波特與密室》距淫,《增長黑客》等前三的豆列收錄書籍過千绞绒,各種類型的書都有,泛而不精榕暇;依據(jù)此進行推薦蓬衡,容易出現(xiàn)推薦錯誤。

《哈利波特與密室》前二豆列

《增長黑客》前三豆列

如《范志紅:吃出健康好身材》推薦《如何學(xué)習(xí)》拐揭,因為兩者的豆列有相似撤蟆,但是相似豆列均為收錄數(shù)過千,泛而不精的豆列(37°暖書單(二) (37°暖))堂污;

(4)標(biāo)簽寬泛不準(zhǔn)確家肯,標(biāo)簽在推薦中的權(quán)重不夠----準(zhǔn)確性不夠,推薦不準(zhǔn)

《范志紅:吃出健康好身材》推薦《如何學(xué)習(xí)》盟猖,因為兩者的標(biāo)簽都命中“學(xué)習(xí)”讨衣,而學(xué)習(xí)這個標(biāo)簽過于寬大。

《截句詩叢冷門》的標(biāo)簽為“詩歌?? 哲思?? =i226+227=?? *合肥·黃山書社*”式镐,《聰明女人說話辦事108個細(xì)節(jié)》的標(biāo)簽為“聰明女人說話辦事108個細(xì)節(jié).pdf?? 說話的藝術(shù)?? 女人?? 女人說話?? 還湊合?? 智慧?? 很好?? 社科”反镇,標(biāo)簽管理不到位,書迷貼上的稀奇古怪的標(biāo)簽限制了小眾圖書的推薦和曝光娘汞。

《增長黑客》推薦《賦能》,標(biāo)簽不相同但是被推薦歹茶,通過閱讀發(fā)現(xiàn)兩者書籍分別屬于互聯(lián)網(wǎng)運營類和領(lǐng)導(dǎo)思維類,與其他被推薦書籍相比你弦,類型差距較大惊豺,推薦由于標(biāo)簽權(quán)重不夠,沒有被剔除禽作。

(5)內(nèi)容強相關(guān)的書籍并未排在前面---排序問題

《運營之光》屬于運營類書籍尸昧,《增長黑客》比《精益數(shù)據(jù)分析》的類型,關(guān)聯(lián)豆列旷偿,熱度(讀過,在讀烹俗,想讀爆侣,評論數(shù)加總)都要高,但是卻排在后面幢妄。

(6)書籍之間相互推薦---多樣性不夠兔仰,推薦冗余

書籍與被推薦書籍之間:《增長黑客》和《運營之光2.0》的推薦書目重合6個;《哈利波特與密室》與《海底兩萬里》的推薦書目重合4個磁浇;與《魯濱遜漂流記》的推薦書目重合5個斋陪;

系列書籍之間:《哈利波特與密室》中推薦了兩本哈利波特系列書籍;《截句詩叢冷門》的推薦書目全是同系列書籍置吓,其對應(yīng)的推薦書籍也推薦本書无虚;

(7)新版本的經(jīng)典書籍和小眾冷門書籍得不到曝光---時效性缺乏

通過抽樣可知,一般都會推薦年份差距不大的書籍衍锚,但是經(jīng)典書籍的新版本和相關(guān)性較高的小眾冷門書籍友题,猜測因為評分,評論數(shù)等不夠戴质,并沒有被推薦度宦,得不到該途徑的曝光。

3.2優(yōu)先級判斷

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末告匠,一起剝皮案震驚了整個濱河市戈抄,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌后专,老刑警劉巖划鸽,帶你破解...
    沈念sama閱讀 221,888評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異戚哎,居然都是意外死亡裸诽,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,677評論 3 399
  • 文/潘曉璐 我一進店門型凳,熙熙樓的掌柜王于貴愁眉苦臉地迎上來丈冬,“玉大人,你說我怎么就攤上這事甘畅」∪铮” “怎么了?”我有些...
    開封第一講書人閱讀 168,386評論 0 360
  • 文/不壞的土叔 我叫張陵疏唾,是天一觀的道長蓄氧。 經(jīng)常有香客問我,道長荸实,這世上最難降的妖魔是什么匀们? 我笑而不...
    開封第一講書人閱讀 59,726評論 1 297
  • 正文 為了忘掉前任缴淋,我火速辦了婚禮准给,結(jié)果婚禮上泄朴,老公的妹妹穿的比我還像新娘。我一直安慰自己露氮,他們只是感情好祖灰,可當(dāng)我...
    茶點故事閱讀 68,729評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著畔规,像睡著了一般局扶。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上叁扫,一...
    開封第一講書人閱讀 52,337評論 1 310
  • 那天三妈,我揣著相機與錄音,去河邊找鬼莫绣。 笑死畴蒲,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的对室。 我是一名探鬼主播模燥,決...
    沈念sama閱讀 40,902評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼掩宜!你這毒婦竟也來了蔫骂?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,807評論 0 276
  • 序言:老撾萬榮一對情侶失蹤牺汤,失蹤者是張志新(化名)和其女友劉穎辽旋,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體慧瘤,經(jīng)...
    沈念sama閱讀 46,349評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡戴已,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,439評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了锅减。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片糖儡。...
    茶點故事閱讀 40,567評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖怔匣,靈堂內(nèi)的尸體忽然破棺而出握联,到底是詐尸還是另有隱情,我是刑警寧澤每瞒,帶...
    沈念sama閱讀 36,242評論 5 350
  • 正文 年R本政府宣布金闽,位于F島的核電站,受9級特大地震影響剿骨,放射性物質(zhì)發(fā)生泄漏代芜。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,933評論 3 334
  • 文/蒙蒙 一浓利、第九天 我趴在偏房一處隱蔽的房頂上張望挤庇。 院中可真熱鬧钞速,春花似錦、人聲如沸嫡秕。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,420評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽昆咽。三九已至驾凶,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間掷酗,已是汗流浹背调违。 一陣腳步聲響...
    開封第一講書人閱讀 33,531評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留泻轰,地道東北人翰萨。 一個月前我還...
    沈念sama閱讀 48,995評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像糕殉,于是被迫代替她去往敵國和親亩鬼。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,585評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 背景 試著對豆瓣讀書詳情頁的推薦模塊——“喜歡讀XXX的人也喜歡”阿蝶,做一個階段性調(diào)研 第一步:找到理想態(tài) 定義豆瓣...
    _HaloWorld閱讀 1,600評論 0 4
  • 現(xiàn)在已經(jīng)很習(xí)慣雳锋,看到什么感興趣書籍后,去豆瓣上查看書籍的評分和評價羡洁,來幫助自己了解這本書玷过,看看是不是適合我。 使用...
    奇穎閱讀 4,229評論 2 5
  • 背景 試著對豆瓣讀書詳情頁的推薦模塊——“喜歡讀XXX的人也喜歡”筑煮,做一個階段性調(diào)研辛蚊。 找到理想態(tài) 理想態(tài)定義:用...
    今至閱讀 324評論 0 0
  • 我們假定剛剛在豆瓣讀書看了《運營之光》這本書,那下面的書籍推薦是怎么來的呢真仲?以下為個人分析思路袋马,如有不完備,請留言...
    白木白閱讀 1,086評論 0 0
  • 我認(rèn)為幸福就是對生活有一種熱愛秸应,這份熱愛支配著我的人生虑凛,我為它而瘋狂,瘋狂的人生充滿了未知數(shù)软啼,但無疑這是值得認(rèn)同的...
    活力向上閱讀 385評論 2 18