思路
關(guān)鍵在于如何得到一系列的文章、用戶全局編號(hào)以及文章發(fā)表和用戶注冊(cè)的時(shí)間戳挽唉,作為時(shí)間-數(shù)量曲線上的二維點(diǎn)滤祖。希望這些點(diǎn)能夠隨時(shí)間較為均勻地分布,這樣瓶籽,幾百個(gè)采樣點(diǎn)足矣匠童。
然而用來(lái)訪問簡(jiǎn)書文章和用戶頁(yè)面里是編號(hào)的hash值,因此不可能簡(jiǎn)單通過編號(hào)遞增的方法產(chǎn)生訪問地址來(lái)獲得時(shí)間戳塑顺。
但稍加分析可發(fā)現(xiàn)汤求,用戶的文章列表中有個(gè)note-id字段俏险,似乎就是文章本身的全局編號(hào)。那么扬绪,找一個(gè)簡(jiǎn)書創(chuàng)立之初就開始連續(xù)發(fā)表文章的用戶竖独,例如@簡(jiǎn)書,那么挤牛,遍歷文章列表獲得note-id和對(duì)應(yīng)發(fā)表時(shí)間就可搞定文章總數(shù)的時(shí)間曲線莹痢。
對(duì)于用戶數(shù)量,發(fā)現(xiàn)搜索用戶的功能里ajax請(qǐng)求可返回包含用戶全局id的json信息墓赴,而用戶主頁(yè)的動(dòng)態(tài)中竞膳,第一條為用戶加入簡(jiǎn)書的時(shí)間。那么诫硕,可搜索常用用戶名的單字顶猜,例如“小”,“的”之類痘括,可保證較為均勻地獲得簡(jiǎn)書創(chuàng)立之初直到現(xiàn)在的用戶信息长窄。
獲取方法
根據(jù)前述思路,寫js腳本纲菌,在chrome瀏覽器中挠日,簡(jiǎn)書頁(yè)面之下運(yùn)行即可,好處是不用寫登錄邏輯翰舌,且滿足同源策略方便ajax嚣潜。細(xì)節(jié)比較簡(jiǎn)單,不贅述椅贱。
結(jié)果
把結(jié)果按照時(shí)間排序懂算,繪制得到:
可見目前文章數(shù)超過1200萬(wàn)庇麦,用戶數(shù)超過600萬(wàn)计技。總體而言山橄,曲線平穩(wěn)上升垮媒。對(duì)比之下,文章數(shù)上升更快航棱,說明大家的創(chuàng)作熱情越來(lái)越強(qiáng)了睡雇。
另外,看到2015年7月附近有些跳變饮醇,推測(cè)是做了推廣吧它抱。
思考題:如何獲得簡(jiǎn)書的日活?