無(wú)標(biāo)題文章

文章介紹

在上一篇博文中,我講述了利用Python的selenium模塊抓取動(dòng)態(tài)數(shù)據(jù)的方法點(diǎn)擊打開(kāi)鏈接柱恤,那么這些抓到的數(shù)據(jù)如何處理呢驮瞧?可以寫入到excel表格中制成表格,進(jìn)而畫成統(tǒng)計(jì)圖表直觀顯示出來(lái)瀑晒。例如按照時(shí)間軸統(tǒng)計(jì)網(wǎng)站的在線人數(shù),查看哪個(gè)時(shí)間段人最多徘意,哪個(gè)時(shí)間段人最少苔悦,從而網(wǎng)站維護(hù)人員可以按照合適的時(shí)間分配資源,用戶則可以選擇合適的時(shí)間訪問(wèn)椎咧。
要做到以上所述的數(shù)據(jù)處理玖详,涉及到兩個(gè)問(wèn)題:
一是如何把數(shù)據(jù)寫入已存在的表格中,并且多次寫入不會(huì)影響先前的數(shù)據(jù)勤讽;
二是如何每隔一段時(shí)間運(yùn)行抓取動(dòng)態(tài)數(shù)據(jù)的函數(shù)和寫入到excel表格的函數(shù)蟋座,Linux下用crontab很好解決,但windows則比較麻煩脚牍。

解決思路

第一個(gè)問(wèn)題向臀,用xlwt模塊不能解決,因?yàn)閤lwt每次都會(huì)把excel文件中已存在的數(shù)據(jù)清除再寫入诸狭,用xlutils模塊可以將數(shù)據(jù)寫入到已存在的excel中而且不影響sheet中原有的數(shù)據(jù)券膀。你需要安裝xlutils模塊君纫,聯(lián)網(wǎng)狀態(tài)下cmd直接輸入pip install xlutils,系統(tǒng)會(huì)找到Python的安裝目錄直接下載解壓并安裝這個(gè)模塊三娩。等到終端提示完成后可以看看庵芭,在C:\Python27\Lib\site-packages目錄下有沒(méi)有selenium模塊,這個(gè)目錄取決于你安裝Python的路徑雀监。如果有xlutils和xlutils-1.7.1-py2.7.egg-info這兩個(gè)文件夾双吆,代表模塊可以在Python程序中被加載了。另外還要安裝xlrd模塊会前,由這個(gè)模塊的子模塊open_workbook對(duì)excel文件執(zhí)行打開(kāi)操作好乐,返回文件對(duì)象讓xlutils的copy子模塊重寫數(shù)據(jù)進(jìn)去,安裝xlrd的方法同上瓦宜。
第二個(gè)問(wèn)題蔚万,其實(shí)沒(méi)那么復(fù)雜,一開(kāi)始還考慮是不是要用到os.system(command)或者windows計(jì)劃任務(wù)什么的临庇?但是往簡(jiǎn)單的角度想反璃,直接寫一個(gè)循環(huán):循環(huán)里面執(zhí)行抓取動(dòng)態(tài)數(shù)據(jù)的函數(shù)和寫入到excel表格的函數(shù),然后time.sleep(x)讓進(jìn)程暫停x秒假夺,接著跳入下一次循環(huán)即可淮蜈。至于什么時(shí)候終止循環(huán),引入計(jì)數(shù)變量即可已卷。

程序?qū)崿F(xiàn)

思路已經(jīng)有了梧田,直接上代碼。
運(yùn)行程序侧蘸,會(huì)自動(dòng)實(shí)現(xiàn)下面一系列的操作:
打開(kāi)瀏覽器并且打印抓取到的數(shù)據(jù)列表->把數(shù)據(jù)寫入到excel中->計(jì)數(shù)變量加1->關(guān)閉session和關(guān)閉瀏覽器裁眯。
每隔半小時(shí)執(zhí)行一次上述的操作流,這里程序設(shè)計(jì)成當(dāng)計(jì)數(shù)變量到20的時(shí)候跳出循環(huán)讳癌,終止程序運(yùn)行穿稳。

運(yùn)行效果

在終端打印的結(jié)果如下(前4次循環(huán)的結(jié)果):



版塊名稱和在線人數(shù)寫入到excel表格里的效果如下:



從中選擇某幾個(gè)版塊,以時(shí)間為橫坐標(biāo)晌坤,在線人數(shù)為縱坐標(biāo)逢艘,插入折線圖,畫出統(tǒng)計(jì)圖表:

這里時(shí)間跨度不大泡仗,在線人數(shù)變化不多埋虹,因此折線圖的效果不是很明顯猜憎,如果讓程序運(yùn)行一天娩怎,統(tǒng)計(jì)24小時(shí)內(nèi)各個(gè)時(shí)間段的在線人數(shù)情況,變化就比較明顯了胰柑。按照這種方法實(shí)現(xiàn)統(tǒng)計(jì)在線人數(shù)截亦,簡(jiǎn)單直接爬泥,并且系統(tǒng)開(kāi)銷很小。唯一要保證的是崩瓤,你的瀏覽器能正確訪問(wèn)指定的url袍啡,程序不會(huì)異常(好像也不好保證的說(shuō)= = )。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末却桶,一起剝皮案震驚了整個(gè)濱河市境输,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌颖系,老刑警劉巖嗅剖,帶你破解...
    沈念sama閱讀 218,607評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異嘁扼,居然都是意外死亡信粮,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,239評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門趁啸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)强缘,“玉大人,你說(shuō)我怎么就攤上這事不傅÷玫啵” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 164,960評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵蛤签,是天一觀的道長(zhǎng)辞友。 經(jīng)常有香客問(wèn)我,道長(zhǎng)震肮,這世上最難降的妖魔是什么称龙? 我笑而不...
    開(kāi)封第一講書人閱讀 58,750評(píng)論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮戳晌,結(jié)果婚禮上鲫尊,老公的妹妹穿的比我還像新娘。我一直安慰自己沦偎,他們只是感情好疫向,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,764評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著豪嚎,像睡著了一般搔驼。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上侈询,一...
    開(kāi)封第一講書人閱讀 51,604評(píng)論 1 305
  • 那天绢馍,我揣著相機(jī)與錄音牡昆,去河邊找鬼翰苫。 笑死,一個(gè)胖子當(dāng)著我的面吹牛温技,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播扭粱,決...
    沈念sama閱讀 40,347評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼舵鳞,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了琢蛤?” 一聲冷哼從身側(cè)響起蜓堕,我...
    開(kāi)封第一講書人閱讀 39,253評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎博其,沒(méi)想到半個(gè)月后俩滥,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,702評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡贺奠,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,893評(píng)論 3 336
  • 正文 我和宋清朗相戀三年霜旧,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片儡率。...
    茶點(diǎn)故事閱讀 40,015評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡挂据,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出儿普,到底是詐尸還是另有隱情崎逃,我是刑警寧澤,帶...
    沈念sama閱讀 35,734評(píng)論 5 346
  • 正文 年R本政府宣布眉孩,位于F島的核電站个绍,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏浪汪。R本人自食惡果不足惜巴柿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,352評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望死遭。 院中可真熱鬧广恢,春花似錦、人聲如沸呀潭。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,934評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)钠署。三九已至糠聪,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間谐鼎,已是汗流浹背舰蟆。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,052評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人夭苗。 一個(gè)月前我還...
    沈念sama閱讀 48,216評(píng)論 3 371
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像隔缀,于是被迫代替她去往敵國(guó)和親题造。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,969評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 1.要做一個(gè)盡可能流暢的ListView猾瘸,你平時(shí)在工作中如何進(jìn)行優(yōu)化的界赔? ①Item布局,層級(jí)越少越好牵触,使用hie...
    fozero閱讀 730評(píng)論 0 0
  • 測(cè)試的基本概念 測(cè)試是軟件生存周期中十分重要的一個(gè)過(guò)程淮悼,是產(chǎn)品發(fā)布、提交給最終用戶前的穩(wěn)定化階段揽思。 1袜腥、 測(cè)試的分...
    金金毛閱讀 2,331評(píng)論 0 1
  • 今夜沁人的寒光 撲來(lái)一陣醉人的清香 它照著我們冷色的衣裝 淡淡地引起一陣悲傷 那是心中的惆悵 你是我最好的朋友 在...
    莫離殤閱讀 166評(píng)論 0 0
  • 12組王真如閱讀 70評(píng)論 0 0
  • 今天是一個(gè)浪漫的日子,農(nóng)歷七月初七钉汗。一大早羹令,群和朋友圈就被情人節(jié)各種祝福、文章刷屏损痰,好不熱鬧福侈。 書房坐定,準(zhǔn)備打電...
    嚴(yán)紅玉閱讀 351評(píng)論 0 0