數(shù)據(jù)來源:簡(jiǎn)書.首頁(yè)投稿 專題
數(shù)據(jù)時(shí)間:2016.1.10-2016.5.10
數(shù)據(jù)量:超10萬(wàn)條文章和作者數(shù)據(jù)
1誊爹、2016-04-17 到底發(fā)生了什么绑改?閱讀量劇增兩倍Qセ肌6ひ摺涉瘾!
根據(jù)分析知态,每天平均閱讀量415772.096,在結(jié)合上圖立叛,數(shù)據(jù)答題在40000的位置波動(dòng)负敏,符合平均閱讀量分析。但是在圖中有一個(gè)明顯的尖峰秘蛇,2016-04-07 閱讀量達(dá)到914477其做。到底這一天發(fā)生了什么顶考?
原因一:這天文章質(zhì)量特別特別好?
4個(gè)月來妖泄,平均每天文章的閱讀量是2071.86次驹沿,而2016年4月7日平均每篇文章閱讀量是2419.25。因此蹈胡,當(dāng)天的文章質(zhì)量和引發(fā)的關(guān)注度并不能成為閱讀量爆增的理由渊季。
真實(shí)原因:系統(tǒng)出BUG 啦
答案呼之欲出,這一天罚渐,奇怪的是大部分文章都被重復(fù)發(fā)表了兩次却汉,顯然就是系統(tǒng)的bug。
2荷并、首頁(yè)投稿管理員們到底有多忙合砂??璧坟?被選上的概率有多屑饶隆?
上一篇分析中已經(jīng)提過雀鹃,簡(jiǎn)書用戶的活躍時(shí)間段是晚上9點(diǎn)到12點(diǎn)幻工,但首頁(yè)投稿和每天1000字的投稿機(jī)制不一樣,每天1000字專題的發(fā)布時(shí)間與投稿時(shí)間相差不遠(yuǎn)黎茎,但首頁(yè)投稿是經(jīng)過管理員審核的囊颅,也就是說文章的發(fā)布時(shí)間是審核員的工作時(shí)間。從上表看出傅瞻,盡管晚上時(shí)段仍然是發(fā)表量最大的踢代,但白天工作時(shí)間的差異并不是很大。
如果通過掐時(shí)間段來進(jìn)行投稿嗅骄,從而增加首頁(yè)投稿收稿的可能性并不會(huì)太大胳挎。
雖然,我沒有得到確切的數(shù)據(jù)計(jì)算通過率溺森,但可以通過其他方面來看看被首頁(yè)投稿選上的概率有多低慕爬?首頁(yè)投稿的每天發(fā)表量是214篇文章,首頁(yè)投稿一共有16位管理員屏积。也就是說每個(gè)管理員每天大概只能審核通過14篇文章医窿,假設(shè)管理員都是上班8小時(shí),也就是說每個(gè)管理員平均每小時(shí)看的文章中篩選出2篇不到的文章收錄如首頁(yè)投稿中炊林。
3姥卢、放假,就是連簡(jiǎn)書都不上了去好好玩
在對(duì)每天發(fā)表文章量的分析中,我發(fā)現(xiàn)了幾個(gè)明顯的低端独榴。閱讀量54的這天是除夕僧叉,135的這天是清明,而180閱讀量的這天是五一括眠。
所以彪标,放假了,就好好玩掷豺,寫什么文章看什么簡(jiǎn)書,去玩氨∩当船!
4、配圖默辨!配圖德频!配圖!
重要的事情說三遍缩幸。我一共分析了首頁(yè)投稿有效文章鏈接26500(某些文章已被作者刪除)壹置,這兩萬(wàn)多篇文章的平均圖片數(shù)是4.5個(gè)。
僅有20%的文章是一張圖都沒有的
5表谊、文章的類型
簡(jiǎn)書的文章沒有被分類钞护,我通過首頁(yè)投稿的文章還被哪些專題錄收來分析首頁(yè)投稿文章都屬于哪些類型?
有5441篇被首頁(yè)投稿收錄的文章爆办,作者也同樣投稿到每天1000字难咕,4716篇文章被世間事收錄。這兩個(gè)專題設(shè)計(jì)的話題很廣泛距辆,而且投稿門檻低余佃,難以反映文章類型。
但藍(lán)色部分就能說明了跨算,首頁(yè)投稿的文章主要集中在閱讀爆土、電影、雞湯和IT诸蚕。
因此步势,如果大家想增加首頁(yè)投稿被收稿的可能,不妨多寫一下這幾方面的文章挫望。
6立润、作者是何方神圣?業(yè)余和專業(yè)作者區(qū)別有多大媳板?
27000篇文章的作者一共是7695位桑腮,也就是說平均每名作者有3篇文章被收錄,其中簽約作者僅僅占了0.8%蛉幸,七月都是非簽約作者破讨。但是丛晦,簽約作者的文章數(shù)、粉絲數(shù)提陶、文章閱讀量是業(yè)余作者的數(shù)倍烫沙。可見隙笆,專業(yè)和非專業(yè)還是不少的區(qū)別锌蓄。
總是抱怨被管理員無(wú)情地拒稿,看看非簽約作者的平均粉絲數(shù)撑柔、文章數(shù)瘸爽、獲贊數(shù)、總字?jǐn)?shù)铅忿,沒達(dá)到就不要抱怨啦剪决,繼續(xù)加油!
無(wú)處不在的二八定律
以前在咨詢實(shí)習(xí)的時(shí)候,遇到無(wú)法確定的數(shù)據(jù)很多時(shí)候用二八原則檀训。這條定律仿佛就是萬(wàn)有定力和進(jìn)化論一樣成為了真理柑潦。
通過對(duì)閱讀量進(jìn)行排序,我發(fā)現(xiàn)總閱讀量在前20%的作者所寫的文章居然占了所有閱讀量的88.6%峻凫,而占所有作者比例1%都不到的簽約作者渗鬼,居然占有了18%的總閱讀量。
所以蔚晨,對(duì)于作者來說乍钻,我們可以成為top20%的作者分享88.6%的閱讀量,同樣也可以成為長(zhǎng)尾的一部分铭腕,針對(duì)某些特定的用戶银择。
二八定律和長(zhǎng)尾理論在商業(yè)上應(yīng)用很廣,在簡(jiǎn)書上如果我們把發(fā)表文章看作個(gè)人品牌的樹立過程累舷,那么把這當(dāng)成是一門生意也未嘗不可浩考。
7、找誰(shuí)當(dāng)簽約作者被盈?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?非簽約作者平均閱讀量TOP 15
閱讀量多小和寫作水平可能沒有直接聯(lián)系析孽,但與用戶的感興趣程度就絕對(duì)成正比。如果我是簡(jiǎn)書的產(chǎn)品經(jīng)理只怎,我就一定會(huì)嘗試讓這些作者成為簽約作者袜瞬,推動(dòng)他們多發(fā)文章,增加閱讀量身堡,增加粉絲邓尤,從而增加用戶對(duì)簡(jiǎn)書的依賴程度。
圖太多,流量黨請(qǐng)見諒汞扎。
我能找到很多關(guān)于IT和編程的論壇和小組季稳,但各位是否有推薦的針對(duì)商業(yè)數(shù)據(jù)分析的論壇和網(wǎng)頁(yè),歡迎評(píng)論澈魄,有任何的意見也同樣歡迎評(píng)論景鼠。
代碼github鏈接:https://github.com/hayleyhou/jianshu-spider/branches