鑒于渣浪的微博feed流算法被罵得特別厲害包蓝,把我知道的算法公布一下驶社。我可沒什么內(nèi)部消息呆奕,只不過長期視奸微博CEO的評論,再加上腦補衬吆,盲人摸象,說錯了你們別怪我绳泉。
我視奸了解到的微博調(diào)整feed流算法逊抡,有三個階段。
1零酪、
第一個階段是打壓藍V和營銷號冒嫡,從去年底開始。
藍V就是企業(yè)認證號四苇,對“營銷號”的定義則是對百萬級粉絲孝凌,高傳播微博進行人工排查,把肉眼可辨識的營銷號標記出來月腋。
算法大致是這樣的蟀架,這批PO主發(fā)布的內(nèi)容,首先只分發(fā)給5%的粉絲榆骚,進行灰度測試片拍。如果互動率高,進一步分發(fā)給15%的粉絲妓肢,最多也就15%捌省。具體的數(shù)字不斷調(diào)整,并不嚴格遵照5-15的標準碉钠。
這么做的理由是纲缓,微博認為藍V和營銷號天然有動力“大量發(fā)布內(nèi)容”,尤其是非原創(chuàng)微博喊废,或低價值的營銷微博祝高。這部分內(nèi)容比例增大,就會擠壓原創(chuàng)內(nèi)容的曝光率污筷,而微博的策略是鼓勵原創(chuàng)褂策,扶持自媒體。畢竟開心網(wǎng)和人人網(wǎng)飲鴆止渴颓屑,放縱轉(zhuǎn)帖組件的惡果歷歷在目斤寂。
你問我怎么看呢,我其實是支持這個算法的揪惦。的確粗暴遍搞,的確不近情理,的確搞一刀切器腋,但廣州市搞一刀切禁摩之后溪猿,治安的確大有好轉(zhuǎn)钩杰,我是親歷者。在當時那個feed流環(huán)境下诊县,可能沒有更好的辦法讲弄,只能犧牲藍V和營銷號的利益,確保更多人的利益依痊。反正當前階段藍V和營銷號對微博生態(tài)的價值不大避除,該種田的時候就得拔草。
很多人對此評論說:“覺得煩我自己會取關(guān)胸嘁,不用你渣浪多事”瓶摆。我作為產(chǎn)品經(jīng)理代答“呵呵”,翻個白眼給你看性宏。
也有人評論說群井,是不是非得用這么粗暴的手段?能不能用更好的方法篩選出內(nèi)容優(yōu)質(zhì)的藍V和營銷號毫胜,而不是一刀切书斜?但我覺得,以優(yōu)質(zhì)內(nèi)容的比例之少酵使,大可不必這么折騰菩佑。畢竟企業(yè)經(jīng)營不是白左小清新,講的不是大愛無疆公平正義凝化,而是效率與投入產(chǎn)出比稍坯。
不過,這套針對藍V和營銷號的算法搓劫,疑似被新的“未讀池”全局算法迭代了瞧哟,稍后再講。
2枪向、
又過了幾個月勤揩,大概是今年春節(jié)后,算法的屠刀砍到了普通用戶頭上秘蛔。正應(yīng)了那句“起初他們…因為我不是…我不說話陨亡; 接著他們…我不說話;最后…再也沒有人為我說話了深员「喝洌”
好吧我是在搞笑(可能你并沒有笑),新的算法我也是支持的倦畅。
新算法大致是這樣的遮糖,即便你是普通用戶,長圖微博被降權(quán)叠赐,轉(zhuǎn)發(fā)被降權(quán)欲账,內(nèi)容觸發(fā)了敏感字被降權(quán)屡江。敏感字包括政治、情色赛不、競品等等惩嘉。
降權(quán)的意思是,你發(fā)出的微博只會被一定比例的粉絲看到踢故,或者在未讀池里排到后面再出來文黎。
這段時間微博面臨的問題有可能是,怎樣增加高價值內(nèi)容的曝光率畴椰?于是對低價值內(nèi)容降權(quán)。什么是低價值內(nèi)容呢鸽粉?比如說長圖的瀏覽體驗不如微博自家的頭條文章斜脂,且內(nèi)容無法導(dǎo)入搜索引擎,所以要降權(quán)触机。轉(zhuǎn)發(fā)的內(nèi)容價值通常不如原創(chuàng)帚戳,也要降權(quán)。敏感字就更不用解釋了儡首。判斷高價值低價值的規(guī)則很多片任,我只猜到這幾個。
然后你多半要問兩個問題蔬胯。
問:為什么非得降權(quán)不可呢对供?為什么不能對優(yōu)質(zhì)內(nèi)容加權(quán)呢?
答:傻孩子氛濒,你想想产场,每天刷微博的時間就這么多,一些內(nèi)容加權(quán)被優(yōu)先看到舞竿,占據(jù)了注意力京景,另一些內(nèi)容相當于被降權(quán)∑保“降權(quán)”的措辭讓你心里不舒服确徙,但結(jié)果其實是一樣的。
問:憑什么要新浪微博來決定我看什么不看什么执桌,憑什么鄙皇?
答:綜合微博feed流的速度,用戶打開微博的頻次仰挣,很大一部分內(nèi)容是被錯過的育苟,這是不可避免的。微博官方有動力來優(yōu)化“可見內(nèi)容”的構(gòu)成椎木,這對于用戶本人來說反倒是不可控的违柏,隨機性的博烂。同樣的事情Facebook做了很多年,也被用戶罵了很多年漱竖,癡心不改禽篱。不改不改就是不改,你有志氣就不要用馍惹。
從產(chǎn)品專業(yè)的角度來講躺率,當feed流速到了某一個地步,用算法來優(yōu)化內(nèi)容構(gòu)成就是一件不可避免的事情万矾,挨罵也是一件不可避免的事情悼吱。因為這個算法起作用,內(nèi)容價值提升的時候良狈,你意識不到后添,覺得是自己眼光好,訂閱的PO主質(zhì)量高薪丁。但是當你發(fā)現(xiàn)訂閱內(nèi)容丟失的時候遇西,人之常情,必定破口大罵严嗜。
渣浪唾面自干粱檀。
罵歸罵,如果feed流的內(nèi)容價值真的提升上去了漫玄,你其實是離不開的茄蚯。邊罵邊用,邊用邊罵睦优。環(huán)球同此涼熱第队,彼岸Facebook搞這套都多少年了,渣浪只是個學生刨秆。什么凳谦?你說Twitter?Twitter用沒用feed流調(diào)節(jié)算法我不知道衡未,但它的市值持續(xù)走低尸执,用戶增長乏力可是不爭的事實。渣浪微博的市值已超過Twitter缓醋,這是10月的最新消息如失。
3、
好了送粱,終于到了本文的重點褪贵。以上兩套算法對普通用戶影響不太大,那么渣浪怎么到了千夫所指,人人喊打的地步呢脆丁?是因為4月左右推出的全局算法世舰,關(guān)鍵字是“未讀池”。
什么叫未讀池呢槽卫?就是指你訂閱PO主所發(fā)的微博跟压,如果你沒刷到過,還是未讀狀態(tài)歼培,就會進入未讀池震蒋。
當你刷新timeline時,會按照一定的規(guī)則躲庄,一次只取出15-30條內(nèi)容查剖,而不是全部未讀內(nèi)容。算法優(yōu)先取權(quán)重高的噪窘,剛剛發(fā)布的內(nèi)容笋庄,取完以后你再刷新,從未讀池里邊接著提取效览。說白了就是“智能分批提取數(shù)據(jù)”无切,而不是傳統(tǒng)的“一次性提取全部未讀數(shù)據(jù)”荡短。
我給你們解釋背后的原因丐枉。
剛才提到過“feed流很大一部分內(nèi)容是被錯過的,這是不可避免的”掘托。比如說你半天刷一次微博瘦锹,這段時間訂閱的PO主產(chǎn)生了80條信息,但平均下來闪盔,一次瀏覽的微博數(shù)量是15-30條弯院,剩下的內(nèi)容看不完,在過去泪掀,它就被浪費掉了听绳。
被浪費掉的內(nèi)容里,很可能有高價值的异赫,特別值得看的椅挣,也被浪費掉了。
然后塔拳,你這段時間特別空閑鼠证,過了15分鐘又去刷微博。這么短的時間間隔靠抑,新產(chǎn)生的信息只有5條量九。你覺得沒意思,就把微博關(guān)掉了。
未讀池在理論上可以完美解決這些問題荠列。一次刷新只出來15-30條內(nèi)容类浪,符合一次瀏覽的統(tǒng)計中位數(shù)。再刷弯予,再出戚宦,再刷,中出锈嫩。直到新內(nèi)容刷空了受楼,就從未讀池里提取高權(quán)重的內(nèi)容,再接下來是未讀池里低權(quán)重的內(nèi)容呼寸。
未讀池的時間容量是3天艳汽,最多存放3天的內(nèi)容。也就是你發(fā)一條微博对雪,用戶在這一刻沒刷到河狐,進了未讀池,內(nèi)容權(quán)重又不高(排在后面分發(fā))瑟捣,那就有可能第3天才被粉絲看到馋艺。當然,也有可能永遠都看不到了迈套。但你想想捐祠,如果用戶“這一刻沒刷到”,就算沒有未讀池桑李,內(nèi)容沉底在下面踱蛀,很大的概率他還是“永遠都看不到了”,未讀池反而增加了這條微博的曝光機會贵白。
未讀池算法對瀏覽者的好處率拒,一方面是你只要不停刷,就不會錯過任何有價值的內(nèi)容禁荒,減少了浪費猬膨;另一方面是空閑時多次刷新,多次刷出來新內(nèi)容打發(fā)時光呛伴,而不是刷兩下就沒有了勃痴。對作者的好處,則是增加了整體曝光率——我測算自己的數(shù)據(jù)磷蜀,瀏覽數(shù)大約增加了1/3召耘。
多完美的解決方案啊,為什么渣浪被罵成了個豬頭呢褐隆?
主要的原因是未讀池打亂了時間線污它。微博和Facebook不一樣,新聞價值更高得多,當內(nèi)容在兩三天內(nèi)從未讀池里分批提取出來衫贬,帶有強烈時間屬性的內(nèi)容顯然是錯亂的德澈。比如球賽結(jié)束兩天后,你還能看見朋友為球員加油固惯,頓時就炸了有沒有梆造。
這個問題非常尷尬,未讀池顯著提升了內(nèi)容體驗葬毫,但也破壞掉了時間線上的新聞體驗镇辉。我又不是渣浪員工,沒深入研究過feed流算法贴捡,我也提不出來解決方案忽肛。從渣浪一意孤行來看,未讀池對數(shù)據(jù)的提升非常顯著烂斋,再加上一家獨大屹逛,不怕用戶跑路,最后還是執(zhí)行未讀池方案汛骂。
所以成千上萬人罵渣浪臭傻逼罕模,我不贊同。臭傻逼能做到一百多億刀的市值帘瞭?渣浪得有多喪心病狂淑掌,才能摧毀用戶體驗而不自知,同時市值和用戶數(shù)持續(xù)上漲图张?
但是換個角度來看锋拖,渣浪微博的戰(zhàn)略很好诈悍,戰(zhàn)術(shù)低能祸轮,一以貫之。未讀池算法剛上線的時候侥钳,犯了特別多的低級錯誤适袜,到現(xiàn)在可能還有不少低級錯誤,挨罵一點都不冤枉舷夺。感覺上“瞎雞巴搞苦酱,完成任務(wù)不過腦”也是渣浪傳統(tǒng),和微信團隊的精英化是冰火兩重天给猾。
4疫萤、
文章寫完了,想都不用想敢伸,就知道涌上來不少人扯饶,沖著我說“收了多少錢為渣浪洗地?”
看我口型:
“洗你媽逼”
“洗你媽逼”
“洗你媽逼”
另外,本文如出現(xiàn)數(shù)據(jù)錯誤很正常尾序,我他媽又不是渣浪分析師钓丰,所有數(shù)字都是憑記憶隨手寫的。我是跟你們講這個道理每币,feed流調(diào)節(jié)算法的動機是什么携丁,好處和壞處是什么。文章也是寫給產(chǎn)品愛好者看的——你看兰怠,我作為一只網(wǎng)紅產(chǎn)品狗都會為渣浪洗地梦鉴,下次再罵feed流亂七八糟的時候,可不可以想想揭保,還有什么更好的解決方案尚揣,而不只是泄憤?
比如說掖举,上次視奸到微博CEO在評論里跟產(chǎn)品負責人說:“某些特定的新聞關(guān)鍵字快骗,是不是就不要進未讀池了?”說明渣浪也在想辦法塔次,改進未讀池帶來的時間線錯亂問題方篮。很難根治,或可改善励负。