本周主要是繼續(xù)調(diào)整排行榜脐往,和同事規(guī)劃一起規(guī)劃新的視頻后臺(tái)休吠,順便也拿到了直播的彈幕樣本數(shù)據(jù)開始規(guī)劃打點(diǎn)算法的優(yōu)化。騷男一場(chǎng)直播XX w+條彈幕啊业簿,excel直接卡死......
兩個(gè)改變:最近開始爬infoq的文章瘤礁,讀起來還蠻有收獲。準(zhǔn)備學(xué)Python了梅尤,沒門腳本語(yǔ)言仿佛分析數(shù)據(jù)還是有點(diǎn)沒底柜思。
講點(diǎn)收獲:
關(guān)于INS的熱門趨勢(shì)算法
看了INS的熱度趨勢(shì)算法,通過tag的趨勢(shì)來大致判斷內(nèi)容趨勢(shì)巷燥。幾個(gè)比較關(guān)鍵的點(diǎn)為:實(shí)時(shí)tag數(shù)量分布到tag在實(shí)時(shí)出現(xiàn)概率的規(guī)范化赡盘,預(yù)測(cè)某tag在某時(shí)數(shù)量分布到tag在某時(shí)出現(xiàn)概率的規(guī)范化。兩者相對(duì)比反差表現(xiàn)的趨勢(shì)(tag活躍度高于預(yù)期反映趨勢(shì)缰揪,使用KL散度計(jì)算)陨享,同時(shí)考慮不同tag代表相同含義的情況。
1. 這塊的難點(diǎn)應(yīng)當(dāng)是預(yù)測(cè)某tag在某時(shí)的數(shù)量分布這一模型,INS選用上周同期的數(shù)據(jù)預(yù)測(cè)并排除方差過大的干擾(學(xué)習(xí)到一點(diǎn)抛姑,多取一些數(shù)據(jù)減小隨機(jī)性赞厕,并設(shè)置默認(rèn)值以防數(shù)據(jù)過少,默認(rèn)值的取值要觀察歷史數(shù)據(jù)分布得出)定硝。
2. 指數(shù)函數(shù)是最常見的衰減函數(shù)的坑傅。
3. 識(shí)別出描述同一趨勢(shì)的tag,選擇最能代表其內(nèi)容的tag喷斋。第一項(xiàng)為計(jì)算各tag間的相似度(第一反應(yīng)居然是協(xié)同過濾唁毒,捂臉,錯(cuò)到八百里外了星爪,協(xié)同過濾對(duì)內(nèi)容解釋度太差)浆西,可從tag共現(xiàn)率,編輯距離(同一標(biāo)簽的不同拼寫)來考慮顽腾。
發(fā)現(xiàn)INS對(duì)熱門趨勢(shì)的定義和我們不同近零,特別是新穎性的定義。
流行度——社區(qū)中要有許多人對(duì)該趨勢(shì)感興趣
新穎性——該趨勢(shì)是關(guān)于一些新東西
時(shí)效性——該趨勢(shì)是在真實(shí)事件發(fā)生時(shí)出現(xiàn)在Instagram上的
有點(diǎn)質(zhì)疑新穎性存在的必要性抄肖,作為社交平臺(tái)久信,舊飯新炒的趨勢(shì)出現(xiàn)和新東西趨勢(shì)的出現(xiàn)應(yīng)當(dāng)被放在同等地位上。
思路應(yīng)用在排行榜算法上
之前的思路是給不同視頻tag設(shè)置不同的衰減速度漓摩,畢竟新聞?lì)悤r(shí)效性更強(qiáng)裙士,衰減速度肯定要大于其他tag。
對(duì)熱門趨勢(shì)的反應(yīng)體現(xiàn)在視頻的瞬時(shí)增長(zhǎng)上管毙,不過現(xiàn)在覺得可以設(shè)定/預(yù)測(cè)一個(gè)閾值反應(yīng)一個(gè)平均的熱度腿椎,超過閾值可有趨勢(shì)熱度加權(quán)(或者使用現(xiàn)在的實(shí)時(shí)平均熱度)。
PS:Instagram的內(nèi)容組織是通過tag夭咬,我們視頻庫(kù)的內(nèi)容組織也是通過tag啃炸,但是兩者最大的區(qū)別是Instagram的tag體系前臺(tái)上看是松散的,偏向于用戶組織的卓舵,畢竟是UGC南用,而且也沒有明顯的層級(jí)關(guān)系;而視頻tag組織是靠運(yùn)營(yíng)根據(jù)經(jīng)驗(yàn)把控掏湾,也符合現(xiàn)在PGC的現(xiàn)狀裹虫。但是未來如果做UGC內(nèi)容,這個(gè)編輯預(yù)設(shè)的tag肯定是不行的呀忘巧,必須要開放用戶打tag......混合個(gè)性化推薦仿佛是個(gè)超大工程Orz
發(fā)現(xiàn)Spotify牛逼的設(shè)計(jì)*1
3D touch預(yù)覽Highlight
以3D touch的觸摸方法可以直接預(yù)覽Artist和list下的歌曲Highlight恒界,當(dāng)前播放進(jìn)度會(huì)被保留睦刃;3D Touch預(yù)覽結(jié)束后可以繼續(xù)當(dāng)前播放砚嘴。這簡(jiǎn)直是解決了一個(gè)大痛點(diǎn)啊,預(yù)覽時(shí)不想破壞當(dāng)前播放進(jìn)度,設(shè)計(jì)的太棒际长∷什桑【不過這個(gè)Highlight算法值得商榷啊......不是很準(zhǔn),有偏移工育,這點(diǎn)在優(yōu)化打點(diǎn)算法的時(shí)候也要考慮】
聽說今年要上Hi-Fi音質(zhì)虾宇??如绸?
剩下的沒啥了......Python學(xué)習(xí)中