article.png
直接上數(shù)據(jù)
簡(jiǎn)書不支持iframe,只能點(diǎn)連接了况毅,連接里的排行是實(shí)時(shí)的哦~
至于這里,只能用工具把html轉(zhuǎn)markdown了母债。
我盡量每周更新!
相關(guān)分析
還做了個(gè)《簡(jiǎn)書“短篇小說(shuō)”作者排名》
11月7日簡(jiǎn)書修改了頁(yè)面格式午磁,導(dǎo)致我的爬蟲爬取失敗尝抖,直到昨天才發(fā)現(xiàn)并修復(fù)毡们。
以下是2017年11月13日爬取的結(jié)果:
簡(jiǎn)書推的內(nèi)容不能滿足需求
最近發(fā)現(xiàn)簡(jiǎn)書的“短篇小說(shuō)”里有許多出彩的文章秉撇。但是官方推的內(nèi)容不能滿足自己的胃口甜攀。
原因兩點(diǎn):
- “熱門”榜里只按照“點(diǎn)贊”數(shù)量排序。發(fā)布時(shí)間越長(zhǎng)的文章越靠前琐馆。
- “最新評(píng)論”和“最新收錄”只按照時(shí)間排序规阀。但是文章質(zhì)量參差不齊,心的文章里很多垃圾瘦麸。
自己動(dòng)手谁撼,豐衣足食
其實(shí)我就是想更方便的找到好的文章
于是自己用Python寫了個(gè)爬蟲程序,然后發(fā)布到自己的樹莓派上滋饲,每天自動(dòng)更新厉碟。
關(guān)于分?jǐn)?shù)計(jì)算
為了避免上面說(shuō)的那些問(wèn)題喊巍,我把分?jǐn)?shù)設(shè)計(jì)成了多項(xiàng)式加權(quán)。包括:
- 閱讀量
- 點(diǎn)贊
- 回復(fù)
- 打賞
- 文章發(fā)布時(shí)間
打臉#
我原本想著找到好文章箍鼓,結(jié)果一看題目崭参,
好狗血!!!。
難怪官方的推薦內(nèi)容都是三觀正的了款咖。
不過(guò)點(diǎn)進(jìn)去看了之后何暮,發(fā)現(xiàn)有些文章的確寫的入木三分。
只是用了"誰(shuí)敢比我慘"或者"誰(shuí)敢比我賤"的噱頭铐殃。
希望有一天海洼,草根小說(shuō)也能不靠“辣眼睛”的題目也能吸引讀者。
那說(shuō)明大家的閱讀鑒賞能力提高了背稼。
持續(xù)改進(jìn)#
個(gè)人覺(jué)得這個(gè)挺有意思贰军,我會(huì)繼續(xù)改進(jìn)玻蝌。
- 相比于昨天的排名變化(已實(shí)現(xiàn))
- 將排行榜頁(yè)面從樹莓派移動(dòng)到coding和github上蟹肘,并支持定時(shí)自動(dòng)更新。(已實(shí)現(xiàn))
- 記錄數(shù)值的歷史數(shù)據(jù)俯树,挖掘更多的有趣規(guī)律(已實(shí)現(xiàn))
- 利用scrapy框架重構(gòu)(已實(shí)現(xiàn))
- 樹莓派升級(jí)到64位系統(tǒng)帘腹,解除32位版本mongodb的2G存儲(chǔ)大小限制。(已實(shí)現(xiàn))
- 爬取更多專輯信息许饿。目前擴(kuò)大到“短篇小說(shuō)”“世間事”“微小說(shuō)”阳欲。(已實(shí)現(xiàn))