興趣推薦系統(tǒng)
1.什么是推薦系統(tǒng)
簡單來說诽偷,推薦系統(tǒng)就是一個負(fù)責(zé)把內(nèi)容推薦給用戶的系統(tǒng)坤学。最早期的內(nèi)容站點(diǎn),可能就是把數(shù)據(jù)放在那里报慕,用戶自己去看深浮,因?yàn)閮?nèi)容就那么多,每個人看到的都是一樣的眠冈,這時候的推薦是針對所有人飞苇。后來內(nèi)容變多了,開始有了分級菜單蜗顽,有了門戶站布卡,各種內(nèi)容站點(diǎn)開始分化,催生了諸如hao123這樣的菜單網(wǎng)站幫助用戶去收集常用網(wǎng)站雇盖,此時推薦基于既定的有某些固定興趣的群體忿等。那之后有了搜索,用戶可能已經(jīng)不滿于分級菜單刊懈,畢竟到了最低級依然有很多內(nèi)容这弧,自己很難找到想要的句葵,于是開始有了搜索引擎但校,用戶自己去進(jìn)行搜索前翎,根據(jù)自己的需求去請求匾旭,此時的人群得到了更詳細(xì)的劃分勾缭,你輸入不同的關(guān)鍵詞昂灵,就可以給出結(jié)果瑟慈,不同的人輸入不同的關(guān)鍵詞結(jié)果是一樣的航唆,此時的內(nèi)容推薦已經(jīng)達(dá)到了一個較細(xì)的粒度将谊,但是是一種目標(biāo)性推薦冷溶。可是如今呢尊浓,或許用戶對搜索出的內(nèi)容也已經(jīng)感到太多逞频,太繁雜,太千篇一律栋齿,于是苗胀,升級到了個性化推薦系統(tǒng)襟诸,每個人看到的內(nèi)容都不一樣,而且用戶不需要絞盡腦汁去思考要輸入什么關(guān)鍵詞基协,你只要去使用就好了歌亲。
2.為什么要有推薦系統(tǒng)
a.設(shè)備的更新。
在pc時代澜驮,推薦或許還沒有那么強(qiáng)烈陷揪,尤其是對于一些內(nèi)容站點(diǎn)。就拿我們新聞網(wǎng)站來舉例子吧杂穷,電腦顯示器是很大的悍缠,直接在瀏覽器看新聞就好了,打開網(wǎng)站可以顯示很多內(nèi)容亭畜,把今天最火的內(nèi)容全放在首頁那也是沒問題的扮休。比如下面是一個新浪新聞首頁截圖,先是一個搜索框拴鸵,接著是導(dǎo)航欄玷坠,再往下是正經(jīng)新聞區(qū),可以下拉劲藐,最起碼有幾百條內(nèi)容展示在首頁上八堡,覆蓋熱點(diǎn)足夠了,有些不熱但優(yōu)質(zhì)的內(nèi)容也能夠得到展示聘芜,而且各個類型的新聞兄渺,包括娛樂,體育汰现,時政挂谍,軍事,教育瞎饲,科技等等都有自己的一席之地口叙,只要稍微動動手,所有內(nèi)容一覽無余嗅战。
下面我們再來看一張新浪新聞的app首頁妄田。都有些什么內(nèi)容?一個搜索框驮捍,4條新聞疟呐,兩條還是置頂?shù)模荒軇佣遥粭l熱點(diǎn)的推送启具,一條其他新聞,還有半條廣告珊泳。就這么少的內(nèi)容富纸。如果趕上視頻囤踩,那一頁只能顯示兩條旨椒,圖文一頁只能顯示3條晓褪,而且你總得給廣告留點(diǎn)位置,不然還怎么吃飯综慎。所以呢涣仿,要提高用戶閱讀量,滿足用戶需求示惊,那只能想想辦法好港。用戶在泛閱讀中是不會給你下拉幾百條看看有沒有自己喜歡的內(nèi)容的。那需要花費(fèi)好多時間米罚, 下拉一次沒內(nèi)容钧汹,再下拉還沒有一點(diǎn)想看的,那估計(jì)就涼涼了录择。推薦就是為了解決這種問題拔莱,能夠從廣闊的內(nèi)容庫中計(jì)算新聞跟用戶的匹配程度,然后根據(jù)每個用戶對內(nèi)容進(jìn)行排序隘竭,這樣每個人看到的內(nèi)容都是經(jīng)過了篩選的符合你口味的內(nèi)容了塘秦,能夠讓你在有限的版面內(nèi),有限的用戶行為內(nèi)盡可能看到想看的內(nèi)容动看。
b.數(shù)據(jù)量的暴漲尊剔。
剛才也說了,過去的內(nèi)容源是很少的菱皆,一天也沒有多少大事發(fā)生须误,小編一天一人能寫一篇文章么,完看比較懸仇轻。那會兒都依賴這些專業(yè)人士來寫新聞京痢,數(shù)據(jù)量不高。現(xiàn)在呢拯田,各種網(wǎng)站應(yīng)運(yùn)而生历造,各種內(nèi)容也開始極大的豐富。多媒體也早就了各種內(nèi)容源的產(chǎn)生船庇,自媒體的開放也降低了內(nèi)容生產(chǎn)者的準(zhǔn)入門檻吭产,誰都可以來寫上幾筆。新聞鸭轮,或者叫泛閱讀開始由PGC模式轉(zhuǎn)向UGC模式臣淤。大量的段子,搞笑窃爷,小視頻邑蒋,迎合大家的低級趣味的內(nèi)容如雨后春筍般生長姓蜂。當(dāng)然,那些高端医吊,學(xué)術(shù)钱慢,專業(yè)的內(nèi)容也開始有了更多生產(chǎn)者,但是相比之下發(fā)展比較緩慢卿堂,畢竟這個世界還是喜歡俗聞的多束莫,況且在泛閱讀這個概念籠罩下,更多的是一些消遣草描。內(nèi)容太多了览绿,也是很麻煩的,這就要有選擇的去看穗慕。但是泛閱讀又不可能讓用戶自己去搜索饿敲,這里面的目的性是很弱的,所以個性化推薦在這個場景中還是很適用的逛绵。
3.一個好的推薦系統(tǒng)
a.預(yù)測用戶行為怀各。
不管是用用戶行為分析,還是用內(nèi)容興趣分析暑脆,不管是社交網(wǎng)絡(luò)分析還是上下文分析渠啤,一個好的推薦系統(tǒng)首先就是去猜,猜用戶的行為添吗,用戶會不會點(diǎn)擊沥曹,會不會購買,猜對贏碟联,猜錯輸妓美。
b.挖掘用戶興趣。
但是光會猜還不行鲤孵,還要幫用戶拓展興趣壶栋。比如我愛攝影,那我買相機(jī)幾乎是一個100%的行為了普监,給我推薦相機(jī)商品贵试,其實(shí)意義不大。因?yàn)椴还芩扑]不推薦凯正,我都會買毙玻。給我推薦相機(jī)周邊,比如三角架廊散,閃光燈桑滩,濾鏡片,這算是一種比較靠譜的挖掘允睹,具備較強(qiáng)的關(guān)聯(lián)關(guān)系运准,這就在一定程度上增加了系統(tǒng)的收益幌氮。但是如果能給我安利一些更潛在的內(nèi)容,比如我壓根就沒有考慮過的興趣胁澳,比如愛爾蘭銅笛该互,這就邁進(jìn)了極大的一步——試探,或許我由于一兩次觀看而選擇了購買這個樂器听哭,那就是相當(dāng)成功的興趣挖掘了慢洋。
c.帶來更多收益。
推薦系統(tǒng)的終極目的陆盘,就是帶來收益。如果空談推薦而沒有收益败明,那是沒有意義的隘马。試想如果一個技術(shù)不能帶來任何價值,那它在企業(yè)中應(yīng)用的意義也是沒有的妻顶,畢竟企業(yè)要盈利酸员。所以推薦系統(tǒng)就是不斷的,反復(fù)的去解決上面兩個問題讳嘱,提升用戶體驗(yàn)幔嗦,增加用戶粘性。
傳統(tǒng)泛新聞推薦閱讀之殤
1.互聯(lián)網(wǎng)價值
在我們泱泱大國沥潭,政治是一個很嚴(yán)肅的問題邀泉,政治正確是很重要的。如果你政治不正確钝鸽,那不好意思汇恤,不管你做什么,都是錯的拔恰。所以必須要跟著主旋律做事因谎。什么樣的內(nèi)容符合互聯(lián)網(wǎng)價值,什么東西不符合颜懊,很多的監(jiān)管機(jī)構(gòu)财岔,付出了大量的人力物力來對我們的網(wǎng)絡(luò)環(huán)境進(jìn)行審查,堅(jiān)決杜絕違背我們新時代精神的東西河爹。所以匠璧,泛閱讀就變得很難做〔伲看看今日頭條患朱,要在泛閱讀做個性化推薦,它包容各種信息炊苫,從中央到地方裁厅,從高雅到低俗冰沙,因?yàn)槿耸潜椴几鱾€角落的,人的需求也是各種各樣的执虹,從經(jīng)濟(jì)利益出發(fā)拓挥,用戶越多越好,那么就需要用更貼合用戶興趣的內(nèi)容去做分發(fā)袋励。有爭議性的東西侥啤,違背社會主義主旋律的東西,打打殺殺的社會新聞茬故,這里xx自焚了盖灸,那里xx被打死了,這些都是互聯(lián)網(wǎng)價值糟粕磺芭,會影響人民的思想赁炎,必須要正能量。后來娛樂新聞也不好發(fā)钾腺,畢竟都是明星那點(diǎn)破事徙垫,戲子無情,每天都是這個跟那個搞上了放棒,這個出軌了姻报,那個出柜了,這些東西都是萬惡的資本主義國家?guī)Ыo我們的垃圾间螟,也需要給禁了吴旋。所以就是在新聞領(lǐng)域那些所謂優(yōu)質(zhì)的內(nèi)容,能激發(fā)大量轉(zhuǎn)發(fā)和評論的內(nèi)容寒亥,基本上都快沒了吧邮府。就剩下點(diǎn)民族仇恨和國家仇恨在這里能引起點(diǎn)大的波瀾。守住互聯(lián)網(wǎng)價值出口溉奕,是對人民負(fù)責(zé)褂傀,對年輕一代負(fù)責(zé),堅(jiān)決不能讓這些文化垃圾影響了下一代的發(fā)展加勤。所以說仙辟,這推薦不好做。其實(shí)這里還有很多內(nèi)容鳄梅,但是不好說太細(xì)了叠国,就這樣吧。如果你能理解就理解戴尸,不能理解就算了粟焊。看下一條。
2.娛樂至死危機(jī)
近些年來项棠,隨著技術(shù)的發(fā)展和智能手機(jī)的普及悲雳,越來越多的娛樂性產(chǎn)品開始占領(lǐng)人們的手機(jī)。
想想十年前香追,電子娛樂合瓢,看個電影要倆小時,玩魔獸世界要若干若干小時透典,這種娛樂快感來的還比較慢晴楔,比較緩。后來峭咒,有了短視頻税弃,玩dota,半小時到一小時爽一把《镉铮現(xiàn)在呢钙皮,小視頻15秒,吃雞顽决,榮耀,也不過十幾分鐘导匣。跟以前相比才菠,那可以說是高潮迭起了,所以很容易沉迷贡定,或者說更容易沉迷赋访。這種東西對人的成長是沒有任何好處的,除了消耗掉你的生命缓待。
在泛閱讀領(lǐng)域來看蚓耽,那就是大量的段子,小視頻旋炒,動圖步悠,幾乎都是惡搞,搞笑瘫镇,低俗的內(nèi)容鼎兽,這些對于提升用戶量,延長用戶停留時長很有用铣除,所以也為流量變現(xiàn)做出了巨大的貢獻(xiàn)谚咬。
可是這些東西很明顯也不符合凈化網(wǎng)絡(luò)環(huán)境的要求,屬于低劣的內(nèi)容尚粘,不符合互聯(lián)網(wǎng)內(nèi)容價值出口的標(biāo)準(zhǔn)择卦,也是要被凈化掉的內(nèi)容。但是沒有這些內(nèi)容,那流量還有那么多嗎秉继,用戶使用時長還有那么長嗎祈噪,變現(xiàn)能力肯定是要下降了。? ??
3.主觀體驗(yàn)過強(qiáng)
泛閱讀的推薦實(shí)在不好做秕噪,從無到有容易钳降,從0%到50%好做,但是50%再提升卻很難腌巾。因?yàn)榉洪喿x的主觀體驗(yàn)實(shí)在是難以捉摸遂填。人們在泛閱讀的時候是有非常大的不確定性的,或者說我們對于用戶的行為和興趣收集是極為有限的澈蝙。不管是依賴興趣吓坚,還是依賴用戶協(xié)同,都很難做到時時刻刻的精準(zhǔn)灯荧,實(shí)際上礁击,用戶在泛閱讀的推薦觀感總是時好時壞,但是也有時好的就覺得很玄幻逗载。
在商品推薦中哆窿,用戶行為一般認(rèn)為是比較好收集的,用戶的消費(fèi)習(xí)慣在一段時間內(nèi)比較固定厉斟,而且根據(jù)商品的屬性挚躯,用戶的購買行為也可以比較確定的劃分。
但是對于泛閱讀來說擦秽,用戶可能在早上的某一時刻只是想看看社會信息码荔,而在下一時刻想了解時事,而下午他想學(xué)習(xí)一些領(lǐng)域新聞感挥,晚上又想看看段子和美女消遣一下缩搅。就算這個用戶的行為已經(jīng)算是比較確定了,但是什么時段去推薦什么內(nèi)容是需要考慮的触幼。但是實(shí)際上一個用戶在這種時段的行為也是不確定的硼瓣,他可能今天想看社會信息,明天又要看娛樂信息域蜗。
還有就是對于泛閱讀文章的評價也因人而異巨双。如何評價質(zhì)量好壞,這很難說霉祸。一個租房信息筑累,推給沒需求的人就是垃圾廣告,但是推給一個正在求租的人那可能就是一個精準(zhǔn)的投放丝蹭。
所以慢宗,沒有詳細(xì)的用戶資料和行為信息,就很難做出詳細(xì)的策略和算法,只能靠挖掘更多的興趣維度和用戶協(xié)同去做各種嘗試镜沽,當(dāng)你已經(jīng)達(dá)到某個還不算太高的水平時敏晤,就已經(jīng)很難去提升了。
4.用戶消費(fèi)升級
其實(shí)這里還是接著上面那個問題缅茉,如今自媒體盛行嘴脾,誰都可以寫上兩句。自媒體生產(chǎn)的文章良莠不齊蔬墩,但是對于文章內(nèi)容質(zhì)量的評價卻很難執(zhí)行译打。因?yàn)樵诜洪喿x領(lǐng)域,人群繁雜沒有固定的全局屬性拇颅,每個內(nèi)容對于不同的用戶群可能價值不同奏司。所以呢,泛閱讀要流量變現(xiàn)樟插,維持一個足夠大的用戶基數(shù)是很有必要的韵洋,但是這也就產(chǎn)生一個問題,在大用戶基數(shù)下的內(nèi)容推薦必然會形成一種大多數(shù)效應(yīng)黄锤,整體的推薦結(jié)果會傾向于大多數(shù)人愛看的結(jié)果搪缨。快手不是沒有好的內(nèi)容鸵熟,今日頭條也不是沒有那些小眾的東西勉吻,但是你很難看到了。除非每個用戶都明白推薦的機(jī)制而自發(fā)自覺的去規(guī)范自己的使用行為去調(diào)教推薦系統(tǒng)來為自己服務(wù)旅赢,推薦那些小眾的優(yōu)質(zhì)的東西。
但是誰都知道那是不可能的惑惶,至少在目前來看煮盼。
所以,很多用戶開始不滿带污,于是開始產(chǎn)生分層現(xiàn)象僵控。他們謀求垂直類優(yōu)質(zhì)站點(diǎn)去獲取那些優(yōu)質(zhì)內(nèi)容,甚至是付費(fèi)也在所不惜鱼冀,而在泛閱讀中只用來消遣报破。而另外一批用戶,可能就迷失在了這些一波接一波的快感之中千绪。
具備垂直內(nèi)容的平臺機(jī)遇
1.沒有政治問題
給你一個迷之微笑充易,這一行大概不需要過多解釋了。
2.更容易掌握的用戶行為
能夠來垂直內(nèi)容平臺的用戶一般都是帶有某種訴求的荸型。要么是基于興趣盹靴,要么是基于想要建立興趣,總之,用戶的關(guān)注點(diǎn)會有一定的收縮稿静,這符合推薦效果收斂的情況梭冠,即便是發(fā)生收斂也可以被容忍。
垂直內(nèi)容一般是針對某一個領(lǐng)域改备,某一個行業(yè)控漠,某一種興趣,用戶行為也相對簡單和可預(yù)測悬钳。即便我們沒有掌握太多用戶的信息盐捷,依然可以在少量用戶行為的情況下去推斷用戶的興趣。
比如說在線教育平臺他去,如果冷啟動用戶沒有看到自己想要的內(nèi)容毙驯,那很可能去搜索關(guān)鍵詞尋找自己想要看的東西。而當(dāng)他看過一個內(nèi)容之后灾测,那對于類似內(nèi)容或者上下游內(nèi)容的遷移也是概率很大的爆价。這在策略和算法上都比較容易控制了。
假如我想學(xué)習(xí)機(jī)器學(xué)習(xí)媳搪,那我可能還會對數(shù)據(jù)挖掘铭段,python等內(nèi)容感興趣。當(dāng)然對于不同的垂直領(lǐng)域秦爆,可以去做相應(yīng)的處理序愚,那就是具體的業(yè)務(wù)拆解了。
3.優(yōu)質(zhì)的內(nèi)容源
比較成熟的垂直內(nèi)容源一般都形成了自己的PGC或者UGC模式等限。由于早期用戶習(xí)慣的培養(yǎng)和整體氛圍的形成爸吮,對內(nèi)容有比較嚴(yán)格的把控,不管是PGC內(nèi)容望门,還是UGC的內(nèi)容都有質(zhì)量上的保障形娇,而且有一些固定的死忠粉。內(nèi)容創(chuàng)業(yè)的時代筹误,有不斷生產(chǎn)的優(yōu)質(zhì)內(nèi)容桐早,就可以傲視群雄了。那么接下來要做的就是厨剪,提升app端編寫的體驗(yàn)哄酝,思考如何激勵創(chuàng)作,從pc轉(zhuǎn)向移動端祷膳。從這些內(nèi)容中挖掘陶衅,標(biāo)注各種興趣標(biāo)簽,使用各種分發(fā)手段去做feed流钾唬,為下一步的變現(xiàn)打好基礎(chǔ)万哪。
4.可以調(diào)整的變現(xiàn)模式
在移動時代侠驯,用戶體驗(yàn)要一切從簡出發(fā),逐步培養(yǎng)用戶習(xí)慣奕巍。有了優(yōu)質(zhì)內(nèi)容吟策,用推薦的手段去吸引用戶,提升用戶體驗(yàn)的止,增加用戶粘性檩坚。有了用戶,那可以繼續(xù)搞點(diǎn)事情诅福,而不是focus在流量變現(xiàn)上了匾委。
首先可以想到的是內(nèi)容付費(fèi),真正的優(yōu)質(zhì)內(nèi)容在海量數(shù)據(jù)下成為一種難以獲取的稀缺資源氓润。研究者認(rèn)為根據(jù)施拉姆信息選擇公式赂乐,人們對媒體的注意或選擇的可能性(然率)與它能夠提供的報償(價值)程度成正比,與人們獲得它的代價(費(fèi)力)程度成反比咖气。也就是說:人們愿意用最小的代價獲取價值最大的新聞信息挨措。這個方向已經(jīng)有很多公司在做了。
之后是升級服務(wù)崩溪,例如以財經(jīng)股票新聞為優(yōu)質(zhì)內(nèi)容的雪球網(wǎng)浅役,可以做一做股票預(yù)測的業(yè)務(wù),以旅游攻略著稱的馬蜂窩可以做一做定制化旅行的業(yè)務(wù)伶唯,這些以優(yōu)質(zhì)內(nèi)容為基石觉既,升級服務(wù),從而獲取更多的收益乳幸。這個就不多說了瞪讼,根據(jù)自己掌握的數(shù)據(jù),還可以有更多的渠道去獲利粹断。
所以呢
所以呢尝艘,泛閱讀的個性化推薦不是不能做,而是在這里姿染,已經(jīng)沒有做下去的意義了。你要受制于很多因素秒际,而這些因素都不是技術(shù)問題悬赏。你沒有好辦法去屏蔽這些問題,那你只能退而求其次去忍耐這些問題娄徊。在泛閱讀里求生存闽颇,要么打造成很多垂直的內(nèi)容,要么就不咸不淡的這樣繼續(xù)下去寄锐。
從泛閱讀解放出來的用戶將會尋求下一個價值出口兵多,在哪呢尖啡?