今日頭條丰捷,大家公認(rèn)的一個(gè)超級(jí)大流量平臺(tái),其最大的特點(diǎn)就是文章的智能推薦系統(tǒng)古涧。
但是灰追,有些人在今日頭條文章動(dòng)輒幾十萬(wàn)递览、幾百萬(wàn)闪金,甚至上千萬(wàn)閱讀疯溺,但有些則只是幾十、幾百的流量毕泌。
除了內(nèi)容本身的質(zhì)量以及賬號(hào)區(qū)別之外喝检,最大的關(guān)鍵就在于其算法推薦規(guī)則。搞懂今日頭條文章推薦規(guī)則撼泛,是在這里進(jìn)行精細(xì)化運(yùn)營(yíng)的核心關(guān)鍵。
那么澡谭,今日頭條海量文章推薦的機(jī)制是怎么樣呢愿题?為什么有的文章展現(xiàn)量幾百萬(wàn)损俭,有的卻只有幾十幾百?對(duì)于文章的推薦機(jī)制我們又能做些什么潘酗?
首先在說(shuō)文章推薦規(guī)則之前杆兵,另一個(gè)機(jī)制大家一定要先了解,那就是今日頭條的消重機(jī)制仔夺。
你在頭條號(hào)發(fā)布的內(nèi)容琐脏,在通過(guò)審核和進(jìn)入推薦系統(tǒng)之間,還有一道難關(guān)缸兔,那就是下面要說(shuō)的消重機(jī)制日裙。
基本上,文章被消重是頭條號(hào)所發(fā)布內(nèi)容無(wú)推薦量的最常見(jiàn)的原因惰蜜。
1想要被推薦昂拂,先了解消重機(jī)制
1)什么是消重?
我們都知道抛猖,在互聯(lián)網(wǎng)上格侯,同樣的文章、圖片财著、視頻往往會(huì)被很多其他媒體轉(zhuǎn)載或復(fù)制联四。
如果我們?cè)诎俣人阉饕黄獌?nèi)容,經(jīng)常會(huì)得到多個(gè)網(wǎng)址撑教。所以朝墩,我們一般需要自己篩選和判斷,哪個(gè)網(wǎng)址更權(quán)威驮履,更有價(jià)值鱼辙,再點(diǎn)擊去訪問(wèn)就可以了。
但是今日頭條不一樣玫镐,它是基于算法推薦給用戶的倒戏。所以一定要保證不能連續(xù)給用戶推薦了幾篇相似的內(nèi)容,否者用戶體驗(yàn)會(huì)非常差:怎么老是給我推薦一樣的內(nèi)容恐似,什么鬼系統(tǒng)杜跷!
所以,今日頭條在推薦你的文章之前矫夷,必須確定這篇內(nèi)容:
● 在系統(tǒng)里是否存在相同或者高度相似的內(nèi)容葛闷?
● 如果存在,那么這篇內(nèi)容的來(lái)源是否是最權(quán)威双藕、最有價(jià)值淑趾、是否最有可能是原創(chuàng)來(lái)源?
那么忧陪,消重就是指對(duì)重復(fù)扣泊、相似近范、相關(guān)的文章進(jìn)行分類和比對(duì),使其不會(huì)同時(shí)或重復(fù)出現(xiàn)在用戶信息流中的過(guò)程延蟹。
今日頭條首先會(huì)通過(guò)消重機(jī)制來(lái)決定同樣主題或內(nèi)容的文章是否有機(jī)會(huì)被推薦給更多用戶评矩。
2)頭條號(hào)內(nèi)容消重的關(guān)鍵項(xiàng)
那如何判斷兩個(gè)內(nèi)容是否相同呢?
如果讓人來(lái)判斷阱飘,可能就要逐字逐句地把文章讀完才能判斷得出來(lái)斥杜。通過(guò)計(jì)算機(jī)這樣去判斷當(dāng)然也是可以的,不過(guò)沥匈,當(dāng)每天需要處理的內(nèi)容達(dá)到十多萬(wàn)篇次的時(shí)候蔗喂,這么做即使對(duì)于計(jì)算機(jī)來(lái)也太麻煩了。
今日頭條的做法是咐熙,通過(guò)系統(tǒng)的計(jì)算弱恒,一篇文章的文本、標(biāo)題棋恼、圖片等都是可以轉(zhuǎn)換成一串?dāng)?shù)字代碼返弹,也就是信息指紋。這就像我們每個(gè)人的身份證爪飘,如果兩個(gè)人的身份證號(hào)碼一模一樣义起,那么就可以肯定這是兩個(gè)一樣的人。
而文字信息的「身份證」也能起到類似的作用师崎,對(duì)于圖片默终、視頻等信息形式,原理也是類似的犁罩。這種算法模型這里就不多說(shuō)了齐蔽,重點(diǎn)來(lái)看影響消重的關(guān)鍵項(xiàng)。
● 來(lái)源頭條號(hào)是否開(kāi)通「原創(chuàng)」標(biāo)記床估;
● 發(fā)布時(shí)間(首發(fā)很重要)含滴;
● 來(lái)源的權(quán)威性和在網(wǎng)絡(luò)上被引用的次數(shù)。
除了內(nèi)容消重的規(guī)則外丐巫,頭條號(hào)平臺(tái)上實(shí)際上還存在這一些針對(duì)內(nèi)容之外的消重規(guī)則:
● 標(biāo)題和預(yù)覽圖片的消重谈况。
這個(gè)原理與內(nèi)容消重相似,只不過(guò)是只比較標(biāo)題以及預(yù)覽圖片的「信息指紋」递胧。
之所以要對(duì)具有相同的標(biāo)題或者預(yù)覽圖片的內(nèi)容進(jìn)行消重(哪怕它們的內(nèi)容并不相同)碑韵,是因?yàn)椋偃缬脩魶](méi)有點(diǎn)擊內(nèi)容詳情頁(yè)缎脾,他是不知道內(nèi)容寫(xiě)的什么的祝闻。
那么,光看標(biāo)題和預(yù)覽圖就是系統(tǒng)把兩篇一樣的內(nèi)容重復(fù)推薦給了自己遗菠,可想而知這樣的瀏覽體驗(yàn)是很糟糕的治筒。
況且屉栓,很少有人愿意連續(xù)點(diǎn)擊幾篇看上去一模一樣的內(nèi)容舷蒲,因此這樣的推薦也很少起效果耸袜。
● 針對(duì)相似主題的消重。
你肯定對(duì)這樣的景象不陌生:每當(dāng)有某個(gè)社會(huì)熱點(diǎn)事件或者話題出現(xiàn)的時(shí)候牲平,媒體堤框、自媒體、KOL們一擁而上纵柿,競(jìng)相報(bào)道事件細(xì)節(jié)或者發(fā)表觀點(diǎn)蜈抓,讓你的微博、朋友圈被有關(guān)這件事的種種內(nèi)容“刷屏”昂儒。
但是沟使,對(duì)于用戶來(lái)說(shuō),需要的其實(shí)并不是反復(fù)看到相同的信息渊跋,如果有足夠優(yōu)質(zhì)的報(bào)道或者觀點(diǎn)的話腊嗡,其實(shí)看有限的幾條就夠了。
相似主題的消重其實(shí)和內(nèi)容的消重其實(shí)原理是一樣的拾酝,是對(duì)文章中全部的關(guān)鍵詞(也就是我們常說(shuō)的標(biāo)簽)進(jìn)行統(tǒng)計(jì)并計(jì)算信息指紋燕少,當(dāng)然也可以對(duì)其中與話題相關(guān)的關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析。
一旦系統(tǒng)發(fā)現(xiàn)了可能對(duì)某篇內(nèi)容感興趣的用戶蒿囤,那么系統(tǒng)會(huì)自動(dòng)把具有同樣「信息指紋」的內(nèi)容或話題中客们,經(jīng)過(guò)挑選最優(yōu)的一篇推薦到用戶的信息流。
剩下具有相同「信息指紋」的內(nèi)容材诽,就幾乎不可能獲得推薦了底挫。
這里,我重點(diǎn)說(shuō)一下相似主題消重脸侥,這個(gè)與我們是最最最相關(guān)的建邓。因?yàn)轭^條要追熱點(diǎn),基本是大家公認(rèn)的事實(shí)湿痢。
3)追熱點(diǎn)小心被消重
在頭條號(hào)追熱點(diǎn)話題的時(shí)候涝缝,一定要謹(jǐn)慎追逐。
因?yàn)橛羞@個(gè)相似主題消重譬重,那具有相同「信息指紋」的話題或熱點(diǎn)拒逮,幾乎不可能獲得推薦了。這就是為什么很多時(shí)候我們的熱點(diǎn)文章在頭條號(hào)會(huì)推薦慘淡臀规。
一個(gè)熱點(diǎn)再熱滩援,用戶的興趣也是有限的,特別是如果你的熱點(diǎn)角度沒(méi)什么區(qū)別塔嬉,平臺(tái)已經(jīng)推薦過(guò)相似內(nèi)容了玩徊,那系統(tǒng)是不愿意再推薦的租悄,因?yàn)橛脩羲呀?jīng)懂了,再推薦就是打擾了恩袱!
所以說(shuō)你追熱點(diǎn)的角度一定要差異化泣棋,寫(xiě)熱點(diǎn)文章有很多切入點(diǎn),你可以把一個(gè)熱點(diǎn)進(jìn)行拆分關(guān)鍵詞畔塔,每一個(gè)都可以是一個(gè)很好的切入口潭辈,這就是所謂的“同主題異角度”。
與此同時(shí)澈吨,你的標(biāo)題也要明顯的差異化把敢,因?yàn)檫@個(gè)熱點(diǎn)標(biāo)簽的提取統(tǒng)計(jì),主要來(lái)自于標(biāo)題谅辣,而后才是內(nèi)容修赞。并且,在一個(gè)大熱點(diǎn)下桑阶,用戶想知關(guān)于熱點(diǎn)的各個(gè)方面柏副,所以標(biāo)題角度也要明顯。
如果不能確定自己創(chuàng)作的角度足夠獨(dú)特联逻,及自己的內(nèi)容足夠優(yōu)質(zhì)搓扯,那么就不要隨意地追逐熱點(diǎn),免得做了無(wú)用功包归。
2今日頭條文章推薦規(guī)則解析
我們知道锨推,文章的閱讀量很大程度上取決于系統(tǒng)的推薦量,那么一篇文章的推薦量公壤,是由什么因素決定的呢换可?
之前,頭條官方給過(guò)一些標(biāo)準(zhǔn)厦幅,即影響文章推薦的 8 個(gè)因素是:
1)點(diǎn)擊率+讀完率:點(diǎn)擊標(biāo)題并讀完文章的人越多沾鳄,推薦越高;
2)分類明確:文章興趣點(diǎn)越明確确憨,推薦越高译荞;
3)文題一致:做恰如其分的標(biāo)題黨;
4)內(nèi)容質(zhì)量:優(yōu)質(zhì)內(nèi)容才是根本休弃;
5)賬號(hào)定位明確:文章題材隨意寬泛的賬號(hào)吞歼,得到推薦的概率更低;
6)互動(dòng)數(shù)塔猾、訂閱數(shù):讀者越活躍篙骡,推薦越多;
7)站外熱度:在互聯(lián)網(wǎng)上關(guān)注度高的話題,推薦越多糯俗;
8)發(fā)文頻率:經(jīng)常發(fā)文尿褪,保持活躍很重要。
不過(guò)這些都是一些表象的東西得湘,這里更系統(tǒng)和深入的說(shuō)一下杖玲,只有知道本質(zhì)了我們才能更好的做好這些。
1)系統(tǒng)是怎樣理解你的文章的忽刽?
今日頭條的文章識(shí)別系統(tǒng)會(huì)對(duì)文章進(jìn)行特征識(shí)別天揖,從而判斷文章講的是什么類型和領(lǐng)域的內(nèi)容。特征識(shí)別的維度有很多跪帝,在這里我們重點(diǎn)解釋「關(guān)鍵詞」齿坷。
系統(tǒng)會(huì)根據(jù)文章中出現(xiàn)的頻率审编,提取出一些詞語(yǔ)作為關(guān)鍵詞,關(guān)鍵詞的判定原則有二:
詞頻高:如一篇體育類文章內(nèi)容關(guān)于某場(chǎng)足球比賽胆数,那么文章可能會(huì)出現(xiàn)的高頻詞就包括球員名字市埋、足球術(shù)語(yǔ)或技巧等黎泣,如「C 羅」、「射門(mén)」缤谎、「突破」抒倚。
同類文章中出現(xiàn)次數(shù)少:作者撰文時(shí)常用到的虛詞、轉(zhuǎn)折詞等出現(xiàn)頻率也很高坷澡,但它們不會(huì)作為關(guān)鍵詞被提取出來(lái)托呕,因?yàn)檫@些詞在文章中是普遍存在的。
系統(tǒng)判定出一篇文章的關(guān)鍵詞后频敛,會(huì)將這些關(guān)鍵詞與文章分類模型進(jìn)行比對(duì)项郊,命中哪些分類詞庫(kù)關(guān)鍵詞的比例大,文章即被打上該分類的標(biāo)簽斟赚。
如着降,一篇文章排名靠前的關(guān)鍵詞為「C 羅」、「射門(mén)」拗军、「西甲」任洞、「馬德里」,那么該篇文章可能會(huì)被打上「足球」发侵、「國(guó)際足球」交掏、「西班牙」等標(biāo)簽,完成對(duì)文章的初步認(rèn)知器紧。
而除文章正文關(guān)鍵詞識(shí)別外耀销,系統(tǒng)還會(huì)對(duì)標(biāo)題進(jìn)行關(guān)鍵詞的識(shí)別和分類比對(duì)。因此,在標(biāo)題中露出具代表性的實(shí)體詞非常重要熊尉。
2)你的文章會(huì)被推薦給哪些用戶罐柳?
每個(gè)人的閱讀興趣都是大不相同的,個(gè)性化推薦機(jī)制要做的事情就是——讓每位用戶看到可能感興趣的內(nèi)容狰住。
這種精準(zhǔn)推薦张吉,是建立在機(jī)器對(duì)每位用戶都有充分認(rèn)知的前提下的。在系統(tǒng)里面催植,每位用戶實(shí)際是由大量數(shù)據(jù)構(gòu)成的肮蛹,用戶的閱讀興趣就藏在這些數(shù)據(jù)中:
● 用戶的基本信息
性別、年齡创南、所處地理位置(城市或地區(qū))伦忠;還有使用機(jī)型、授權(quán)賬戶(如微博稿辙、微信等)昆码、手機(jī)上經(jīng)常使用的其他 App 等。
● 用戶主動(dòng)訂閱或喜歡的內(nèi)容
訂閱帳號(hào)邻储;訂閱頻道赋咽;關(guān)注的話題。
● 機(jī)器通過(guò)計(jì)算得出的用戶閱讀興趣
用戶閱讀過(guò)的文章分類和關(guān)鍵詞吨娜;相似類型用戶還喜歡閱讀的其他文章類型脓匿;用戶在今日頭條客戶端主動(dòng)標(biāo)記「不感興趣」的實(shí)體詞或文章類型。
根據(jù)以上數(shù)據(jù)宦赠,系統(tǒng)對(duì)用戶的閱讀興趣就能有個(gè)基本的判斷陪毡。然后通過(guò)對(duì)數(shù)據(jù)的處理,每位用戶將被系統(tǒng)打上各種標(biāo)簽袱瓮。
如一個(gè)用戶閱讀的文章中關(guān)鍵詞排名靠前的是:C羅缤骨、皇家馬德里、歐洲杯尺借、小米绊起、魅族、蘋(píng)果燎斩。
那么虱歪,這位用戶可能被打上「足球、「皇馬」栅表、「科技」笋鄙、「手機(jī)」、「米粉」等標(biāo)簽怪瓶。不同的用戶會(huì)被打上不同的標(biāo)簽萧落。
最后,當(dāng)一篇帶有「C 羅」、「足球」標(biāo)簽的文章在進(jìn)行推薦時(shí)找岖,系統(tǒng)會(huì)將其自動(dòng)匹配給帶有「C 羅」或「足球」標(biāo)簽的用戶陨倡,這便是推薦引擎的個(gè)性化推薦。
當(dāng)然许布,系統(tǒng)推薦的實(shí)際情況會(huì)遠(yuǎn)比這復(fù)雜得多兴革,但推薦的基本原理便是:
系統(tǒng)先通過(guò)數(shù)據(jù)來(lái)來(lái)給內(nèi)容和用戶打上各種標(biāo)簽,然后通過(guò)算法將內(nèi)容標(biāo)簽跟用戶標(biāo)簽進(jìn)行匹配蜜唾,接著根據(jù)第一批推薦情況杂曲,決定后續(xù)的推薦量,這個(gè)下面說(shuō)袁余。
3)你的文章是如何被推薦的擎勘?
為讓受歡迎的內(nèi)容被更多用戶看到,不受歡迎的內(nèi)容不占用過(guò)多推薦資源泌霍。頭條號(hào)文章在推薦時(shí)货抄,會(huì)分批次推薦給對(duì)其感興趣的用戶。
如何理解分批次推薦呢朱转?
文章首先會(huì)被推薦給一批對(duì)其最可能感興趣的用戶(這批用戶的閱讀標(biāo)簽與文章標(biāo)簽重合度最高),這批用戶產(chǎn)生的閱讀數(shù)據(jù)积暖,將對(duì)文章下一次的推薦起到?jīng)Q定性作用藤为。
數(shù)據(jù)包括點(diǎn)擊率、收藏?cái)?shù)夺刑、評(píng)論數(shù)缅疟、轉(zhuǎn)發(fā)數(shù)、讀完率遍愿,頁(yè)面停留時(shí)間等存淫,其中,點(diǎn)擊率占的權(quán)重最高沼填。
這很好理解桅咆,能吸引眾多用戶點(diǎn)擊的文章自然會(huì)被認(rèn)為更可能是好文章。
文章的首次推薦坞笙,如果點(diǎn)擊率低岩饼,系統(tǒng)認(rèn)為文章不適合推薦給更多的用戶,會(huì)減少二次推薦的推薦量薛夜;如果點(diǎn)擊率高籍茧,系統(tǒng)則認(rèn)為文章受用戶喜歡,將進(jìn)一步增加推薦量梯澜。
以此類推寞冯,文章新一次的推薦量都以上一次推薦的點(diǎn)擊率為依據(jù)。此外,文章過(guò)了時(shí)效期后吮龄,推薦量將明顯衰減俭茧,時(shí)效期節(jié)點(diǎn)通常為24小時(shí)、72小時(shí)和一周螟蝙。
因?yàn)檫@種擴(kuò)大推薦的機(jī)制恢恼,你想獲得更多的閱讀量,就必須努力把各維度閱讀數(shù)據(jù)(點(diǎn)擊率胰默、用戶閱讀時(shí)間场斑、收藏?cái)?shù)、評(píng)論數(shù)牵署、讀完率等)維持在高位水平漏隐。這也就上面官方的一些標(biāo)準(zhǔn)。
其中奴迅,至關(guān)重要的當(dāng)然是點(diǎn)擊率青责,也因此,標(biāo)題和封面圖的重要性便不言而喻取具。這也是今天注意力稀缺時(shí)代脖隶,文章獲得好的傳播的關(guān)鍵要素。
雖然如此暇检,但除了點(diǎn)擊率产阱,有一個(gè)特別重要的點(diǎn)總是被大家忽視,就是:
文章所對(duì)應(yīng)的標(biāo)簽块仆,直接決定了匹配的相對(duì)應(yīng)標(biāo)簽的用戶量构蹬。有的標(biāo)簽本身就對(duì)應(yīng)很大體量的用戶,而有的標(biāo)簽對(duì)應(yīng)人群很小悔据,就算點(diǎn)擊率再高庄敛,天花板也很低。
這就是為什么很多專業(yè)性文章閱讀不高科汗,而情感雞湯藻烤、娛樂(lè)八卦、社會(huì)新聞的推薦一般會(huì)很高肛捍。這也是為什么大家都會(huì)去追熱點(diǎn)隐绵,因?yàn)闊狳c(diǎn)標(biāo)題對(duì)應(yīng)的用戶群體非常大。
所以說(shuō)拙毫,我們選題依许,包括文章標(biāo)題以及內(nèi)容里面的關(guān)鍵詞使用,一定要基于用戶量大的標(biāo)簽缀蹄,這樣可以獲得更多的推薦量峭跳。
之前今日頭條官方就發(fā)過(guò)最受歡迎的一些標(biāo)簽膘婶,這些都是一級(jí)標(biāo)簽,你有沒(méi)有經(jīng)常使用蛀醉?
而且悬襟,今日頭條還專門(mén)推出了熱詞分析功能,幫助大家找到不錯(cuò)的標(biāo)簽拯刁。利用熱詞分析功能可以大大增加系統(tǒng)推薦量脊岳,提高文章的閱讀量。