嗶哩嗶哩動畫標簽系統(tǒng)使用場景及功能描述標簽的建立投稿自主輸入標簽
投稿時點擊主站推薦標簽
欣賞視頻主動編輯標簽(標簽編輯僅提供新增和舉報功能)
標簽的運用二級分區(qū)展現(xiàn)的熱門標簽稍浆,點擊后該頁面根據(jù)標簽展現(xiàn)內(nèi)容
點擊視頻下方標簽可訂閱
點擊視頻下方標簽可搜索包含該標簽文本的標題視頻
標簽當前的問題標簽準確度低標簽同義(eg.鹿晗=LuHan=luhan…...)
標簽模糊(eg.小鹿是明星鹿晗麻捻、是小鹿斑比也是叫小鹿的up主)
垃圾標簽
系統(tǒng)問題標簽之間關聯(lián)度低
標簽維度單一(標簽與用戶無關聯(lián),僅與視頻關聯(lián))
建議標簽的建立從視頻描述和評論抽取標簽
標簽的運用點擊標簽搜索展現(xiàn)的搜索結果拓展至標簽與搜索字符(及其同義標簽)匹配
視頻欣賞結束后的個性化推薦的內(nèi)容與標簽關聯(lián)
在搜索框輸入字符時搜索框下拉列表展現(xiàn)已輸入推薦詞(熱門標簽)
對用戶屬性標簽化溶锭,推薦相關興趣圈或人
用戶細分(eg.在推廣游戲的時候可以更精準)
#
完善標簽系統(tǒng)解決方案
步驟一標簽規(guī)范去偽純真逻淌、結構化
步驟二完善標簽數(shù)據(jù)統(tǒng)計補充關于用戶的數(shù)據(jù)統(tǒng)計
補充關于標簽的數(shù)據(jù)統(tǒng)計
補充關于視頻的數(shù)據(jù)統(tǒng)計
步驟三建立用戶行為模型庫用戶關注up主行為
用戶訂閱標簽行為
標簽搜索行為
熱門標簽瀏覽行為
……
步驟四建模及算法測試
步驟五評估及優(yōu)化
規(guī)范方式說明
標簽規(guī)范清洗去掉空值標簽標簽字符前為空格的標簽
去掉異常標簽字符包含漢語與字母的超長字符惜纸、純數(shù)字字符
標簽同義語義分析等價術語清單
標簽模糊語義分析優(yōu)選術語清單與受控詞表
標簽定義標簽熱度熱度受搜索跳纳、標簽點擊忍饰、重復數(shù)、時間軸影響
標簽系統(tǒng)完善映射標簽棒旗、視頻和用戶相互映射影響
數(shù)據(jù)埋點及采集示例(完善標簽相關數(shù)據(jù))
分析目標統(tǒng)計分類統(tǒng)計需求數(shù)據(jù)上報字段字段說明統(tǒng)計/展現(xiàn)方式分析維度業(yè)務邏輯描述/觸發(fā)條件
標簽熱度標簽推薦系統(tǒng)標簽點擊人數(shù)記錄id范圍:分區(qū)和全站點擊搜索場景操作截圖
標簽點擊次數(shù)點擊時間時間:每日訂閱場景
標簽訂閱人數(shù)點擊人id分區(qū)熱門標簽展現(xiàn)
標簽訂閱次數(shù)訂閱時間平臺及時間
待補充標簽所在頁面信息
點擊標簽跳轉頁面
客戶端
版本
標簽來源標簽有熱門標簽和視頻下方標簽
用戶行為說明模型建設流程(從上之下)備注
用戶-標簽映射瀏覽視頻頁面對瀏覽頁面提取標簽作為用戶的屬性標簽識別用戶瀏覽及打標行為系統(tǒng)的整個架構可能要進行改造
關注的標簽提取關注的標簽作為用戶的屬性標簽確認標簽相關行為
關注人列表提取關注人擁有的標簽作為用戶的參考屬性標簽計算用戶標簽權重及相似度
興趣圈對興趣圈提取用戶屬性標簽生成用戶標簽熱圖或矩陣
個性化推薦:
視頻頁面視頻頁面與用戶標簽維度的匹配度
主站當日熱門視頻與用戶標簽溫度的匹配度