熱門列表的實現(xiàn)思路整理


title: 熱門列表的實現(xiàn)思路整理
date: 2018-09-09
tags: [工作筆記]


熱門的規(guī)則

對于熱門文章的定義是:

單位時間內(nèi)付秕,活躍度(”分享“數(shù) + ”點贊“數(shù) + ”評論“數(shù)的總和)大于某特定值的文章叉讥,被視為熱門文章。

熱門文章的列表是由后臺動態(tài)生成的崭放,而且在每次生成的時候鬼吵,產(chǎn)生的數(shù)據(jù)不一定是相同的扣甲。為了減輕系統(tǒng)的壓力和提高api的響應(yīng)速度,該計算任務(wù)使用celery 進行后臺任務(wù)調(diào)度。

后臺定時任務(wù)循環(huán)執(zhí)行琉挖,任務(wù)執(zhí)行時向緩存數(shù)據(jù)庫中插入當前計算出的符合規(guī)則的熱門文章的索引值启泣,緩存數(shù)據(jù)庫采用的是redis。

定時任務(wù)的實現(xiàn)

  • 將新增的熱門文章索引寫入緩存數(shù)據(jù)庫中示辈,插入的時候寥茫,score 值取當前時間戳。
  • 清除一定時間前的熱門文章矾麻。

新增熱門文章

計算熱門文章sql 語句實現(xiàn)如下(暫時不考慮分享的數(shù)據(jù)):

SELECT result.user_publish_id FROM (
    SELECT a.user_publish_id, COUNT(*) AS count FROM
    (
        SELECT p.user_publish_id
        FROM user_publish AS p
        JOIN user_like AS l
        ON
            l.for_obj = p.user_publish_id AND l.like_type = 0 AND l.created_at > '{0}'
        WHERE p.status = 'VISIBLE'

        UNION ALL

        SELECT p.user_publish_id
        FROM user_publish AS p
        JOIN user_comments AS c
        ON
            p.user_publish_id = c.publish_id AND c.status = 'VISIBLE' AND c.created_at > '{0}'
        WHERE p.status = 'VISIBLE'

    ) AS a
    WHERE a.user_publish_id not in ("{2}")
    GROUP BY a.user_publish_id
) AS result
WHERE result.count >= {1}

(user_publish 用戶發(fā)布文章信息表纱耻,user_like 用戶點贊表,user_comments 用戶評論表)
以上sql語句完成了對符合熱門條件的文章的篩選险耀,返回的結(jié)果集中將不包含應(yīng)已經(jīng)在緩存數(shù)據(jù)庫的中索引弄喘。

將以上返回的文章索引插入redis:

pipeline.zadd(ALL_HOT_KEYS_CACHE, time.time(), item)

(ALL_HOT_KEYS_CACHE redis 中有序集合的鍵)

清除一定時間前的熱門文章

熱門文章進入緩存之后,需要在一定的時間內(nèi)清除甩牺,這是因為被寫入redis的之后蘑志,score不會被改動。定時任務(wù)需要將距離當前較遠的緩存數(shù)據(jù)刪除以減輕緩存的壓力柴灯。

后端的實現(xiàn)

熱門類別的分頁沒有上一頁與下一頁之說卖漫。客戶端在請求的時候赠群,有兩種參數(shù)情況:

  • count:要多少條數(shù)據(jù)
  • publish_ids:客戶端已經(jīng)緩存的文章id列表

客戶端如果僅傳入count 參數(shù),后端將返回最新的count條數(shù)據(jù)信息旱幼。
如果傳入countpublish_ids查描,后端返回的count數(shù)據(jù)中,publish_ids中包含的文章信息將不會被緩存柏卤。

這樣保證了客戶端數(shù)據(jù)的不重復(fù)問題冬三。但是隨著客戶端瀏覽的數(shù)據(jù)越來越多,把么客戶端請求的publish_ids列表也越大缘缚,后端去重的時候復(fù)雜度較高勾笆。但是解決這個問題得力于redis的集合操作方法。


# redis_utils.py

def get_redis_sorted_set_diffs(uid, items, count):
    
    user_key = USER_HOT_KEYS_CACHE.format(uid)
    user_hot_key_cache(items, user_key)
    dest = USER_HOT_KEYS_DESTINATION_CACHE.format(uid)
    redis_store.zunionstore(dest, {ALL_HOT_KEYS_CACHE: 1, user_key: 0}, 'MIN')

    x = redis_store.zrevrangebyscore(dest, '+inf', 1)[:count]
    redis_store.delete(user_key)
    redis_store.delete(dest)
    return x

返回的數(shù)據(jù)排序按照redis返回的集合順序桥滨。

客戶端相關(guān)的任務(wù)

  • 用戶首次進入列表界面時窝爪,請求不要攜帶publish_ids
  • 用戶下拉刷新的操作同首次進入列表界面的操作齐媒。
  • 用戶上拉瀏覽列表的時候蒲每,需要攜帶publish_ids,用于后端管理去重喻括。

存在的問題

  • 客戶端訪問時需要攜帶大量的已經(jīng)緩存的文章id邀杏。
  • 后端獲取數(shù)據(jù)時的去重,隨著publish_ids越來越繁瑣唬血。
  • 客戶端處理較為繁瑣

社區(qū)排行榜和熱門列表的實現(xiàn)思路對比

相同:

  • 順序都是動態(tài)變化的
  • 都需要額外的資源來保證需求的實現(xiàn)
  • 客戶端處理比較繁瑣

不同:

  • 社區(qū)排行榜是有序的望蜡,熱門列表是設(shè)置門檻的唤崭。
  • 社區(qū)排行榜是需要記錄關(guān)注人數(shù)的,熱門不需要記錄活躍度點贊數(shù)和評論數(shù)均取實時的脖律。
  • 社區(qū)有分頁參數(shù)浩姥,熱門列表是沒有上一頁下一頁的概念的,僅需要聲明count的大小
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末状您,一起剝皮案震驚了整個濱河市勒叠,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌膏孟,老刑警劉巖眯分,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異柒桑,居然都是意外死亡弊决,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門魁淳,熙熙樓的掌柜王于貴愁眉苦臉地迎上來飘诗,“玉大人,你說我怎么就攤上這事界逛±ジ澹” “怎么了?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵息拜,是天一觀的道長溉潭。 經(jīng)常有香客問我,道長少欺,這世上最難降的妖魔是什么喳瓣? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮赞别,結(jié)果婚禮上畏陕,老公的妹妹穿的比我還像新娘。我一直安慰自己仿滔,他們只是感情好惠毁,可當我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著堤撵,像睡著了一般仁讨。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上实昨,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天洞豁,我揣著相機與錄音,去河邊找鬼。 笑死丈挟,一個胖子當著我的面吹牛刁卜,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播曙咽,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼蛔趴,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了例朱?” 一聲冷哼從身側(cè)響起孝情,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎洒嗤,沒想到半個月后箫荡,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡渔隶,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年羔挡,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片间唉。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡绞灼,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出呈野,到底是詐尸還是另有隱情低矮,我是刑警寧澤,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布际跪,位于F島的核電站商佛,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏姆打。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一肠虽、第九天 我趴在偏房一處隱蔽的房頂上張望幔戏。 院中可真熱鬧,春花似錦税课、人聲如沸闲延。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽垒玲。三九已至,卻和暖如春找颓,著一層夾襖步出監(jiān)牢的瞬間合愈,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留佛析,地道東北人益老。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像寸莫,于是被迫代替她去往敵國和親捺萌。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內(nèi)容