在前一篇文章中我制定了用戶畫像的計劃,第一部分就是數(shù)據(jù)建模觉鼻。以“一面APP”為例徐绑。
一、一面產(chǎn)品介紹
為了更好地理解如何為一個產(chǎn)品做數(shù)據(jù)建模白群,我這邊先對一面APP做一個簡單的介紹。我們的愿景是遇見你想遇見的世界硬霍。
- 訂閱對你有價值的所有——面對嘈雜的信息困擾帜慢,一面實現(xiàn)了主題聚合化訂閱,只給你想看的唯卖。通過創(chuàng)建主題選擇機器人配件實現(xiàn)不同平臺的內(nèi)容訂閱粱玲。
- 遇見你想遇見的人——在圈子創(chuàng)建一個世界,和惺惺相惜之人不期而遇耐床。創(chuàng)建圈子邀請好友加入圈子密幔,實現(xiàn)人與人之間的聯(lián)系,通過發(fā)表話題實現(xiàn)人與人之間的社交撩轰。
1.0胯甩、創(chuàng)建主題
一大波機器人配件在路上...
1.1、動態(tài)頻道
首先是動態(tài)頻道堪嫂,里面有我的訂閱和我的消息兩個Tab偎箫。
1.2、圈子頻道
創(chuàng)建圈子邀請好友加入圈子皆串,實現(xiàn)人與人之間的聯(lián)系淹办,通過發(fā)表話題實現(xiàn)人與人之間的社交。
1.3恶复、發(fā)現(xiàn)頻道
遇見你想遇見的信息流怜森,這塊后面也會根據(jù)更精準的用戶畫像進行匹配信息。
1.4谤牡、我的頻道
我訂閱的主題副硅、我創(chuàng)建的主題、我訂閱的專輯翅萤、我創(chuàng)建的專輯以及我的收藏恐疲。
好了,廣告打完之后,讓我們從“一面APP”產(chǎn)品中提取對象和標簽培己。
二碳蛋、為一面APP數(shù)據(jù)建模
2.1、為“一面APP”提取對象省咨、對象的標簽以及標簽的權(quán)重
一面APP最重要的對象就是內(nèi)容肃弟,除此之外還有“圈子”、“主題”茸炒、“專輯”及“機器人配件”等對象愕乎。
文字類的標簽需要根據(jù)算法提取阵苇,其它非文字類的標簽根據(jù)每個產(chǎn)品的業(yè)務不同進行確定壁公。
涉及到第三方平臺的可以把第三方平臺的用戶畫像納入?yún)⒖贾笜耍切枰诖嘶A上乘以10%绅项。
權(quán)重值1為滿分紊册。
對象 | 特性 | 標簽 | 權(quán)重 | 備注 |
---|---|---|---|---|
內(nèi)容 | 文字 | XXX | X | 算法提取文章內(nèi)容的關鍵詞及關鍵詞的權(quán)重 |
圈子 | 成員是一男一女 | 戀愛中 | 0.8 | |
圈子 | 成員是一男一女 | 已結(jié)婚 | 0.6 | |
圈子 | 成員是兩男 | 同志 | 0.8 | |
圈子 | 成員是兩男 | 兩兄弟 | 0.7 | |
圈子 | 成員是兩女 | 多姐妹 | 0.7 | |
機器人微博內(nèi)容 | 用戶為馬化騰 | 行業(yè)人物 | 0.6 | 通過百度百科獲取用戶標簽 |
機器人微博內(nèi)容 | 用戶為馬化騰 | 經(jīng)濟人物 | 0.6 | 通過百度百科獲取用戶標簽 |
機器人微博內(nèi)容 | 用戶為馬化騰 | 人物 | 0.6 | 通過百度百科獲取用戶標簽 |
機器人微博內(nèi)容 | 用戶為馬化騰 | 互聯(lián)網(wǎng)人物 | 0.6 | 通過百度百科獲取用戶標簽 |
機器人知乎 | 用戶為helloworlds | 互聯(lián)網(wǎng) | 0.8 | 通過知乎用戶主頁的所在行業(yè)和職業(yè)經(jīng)驗 |
機器人知乎 | 用戶為helloworlds | IT 工程師 | 0.8 | 通過知乎用戶主頁的所在行業(yè)和職業(yè)經(jīng)驗 |
2.2、為“一面APP”確定每個對象在不同位置的權(quán)重
權(quán)重設定的原則為:與用戶的關系越直接快耿,關系越密切囊陡,權(quán)重越高。
類似的掀亥,動態(tài)我的訂閱中更新內(nèi)容信息流的權(quán)重大于動態(tài)我的消息里面的內(nèi)容撞反;我的收藏的內(nèi)容權(quán)重大于我創(chuàng)建主題的內(nèi)容的權(quán)重。
對象 | 位置 | 權(quán)重 | 備注 |
---|---|---|---|
內(nèi)容 | 動態(tài)頻道-內(nèi)容 | 0.5 | 權(quán)重值1為分數(shù) |
內(nèi)容 | 動態(tài)頻道-訂閱的主題-內(nèi)容 | 0.6 | 權(quán)重值1為分數(shù) |
內(nèi)容 | 圈子頻道-圈子列表-內(nèi)容 | 0.7 | 權(quán)重值1為分數(shù) |
內(nèi)容 | 發(fā)現(xiàn)頻道-最熱內(nèi)容-內(nèi)容 | 0.5 | 權(quán)重值1為分數(shù) |
內(nèi)容 | 發(fā)現(xiàn)頻道-熱門主題-內(nèi)容 | 0.6 | 權(quán)重值1為分數(shù) |
內(nèi)容 | 我的頻道-我訂閱的主題-主題內(nèi)頁-內(nèi)容 | 0.8 | 權(quán)重值1為分數(shù) |
圈子 | 圈子頻道-圈子列表 | 0.8 | 權(quán)重值1為分數(shù) |
圈子 | 主題內(nèi)頁-收入的圈子-圈子 | 0.9 | 權(quán)重值1為分數(shù) |
2.3搪花、為“一面APP”確定對每個對象進行不同行為的權(quán)重
對象 | 行為 | 權(quán)重 | 備注 |
---|---|---|---|
內(nèi)容 | 瀏覽 | 0.5 | |
內(nèi)容 | 點贊 | 0.6 | |
內(nèi)容 | 評論 | 0.7 | |
內(nèi)容 | 收藏 | 0.9 | |
內(nèi)容 | 分享 | 0.8 | |
圈子 | 瀏覽 | 0.5 | |
圈子 | 加入 | 0.8 | |
圈子 | 創(chuàng)建 | 1.0 | |
圈子 | 分享 | 0.8 |
2.4遏片、為“一面APP”確定時間衰減值
這里的時間粒度,與產(chǎn)品的不同階段有很大的關系撮竿。
時間 | 時間分類 | 衰減值 | 備注 |
---|---|---|---|
最后時間 | 1小時前 | 0.95 | 最后操作的時間 |
最后時間 | 6小時前 | 0.85 | 最后操作的時間 |
最后時間 | 12小時前 | 0.75 | 最后操作的時間 |
最后時間 | 24小時前 | 0.65 | 最后操作的時間 |
總時長 | 0-1天 | 0.5 | 最后操作時間-最初操作時間 |
總時長 | 1-7天 | 0.6 | 最后操作時間-最初操作時間 |
總時長 | 7-30天 | 0.7 | 最后操作時間-最初操作時間 |
總時長 | 30-90天 | 0.8 | 最后操作時間-最初操作時間 |
總時長 | 90-天 | 0.9 | 最后操作時間-最初操作時間 |
平均啟動時間間隔 | 0-1天 | 0.9 | 總時長/啟動次數(shù) |
平均啟動時間間隔 | 1-7天 | 0.8 | 總時長/啟動次數(shù) |
平均啟動時間間隔 | 7-30天 | 0.7 | 總時長/啟動次數(shù) |
平均啟動時間間隔 | 30-90天 | 0.6 | 總時長/啟動次數(shù) |
平均啟動時間間隔 | 90-天 | 0.5 | 總時長/啟動次數(shù) |
三吮便、為一面APP數(shù)據(jù)建模
下面要做的就是通過算法為文章打上標簽。下一篇文章介紹幢踏。