快下班了,正好準(zhǔn)備去買彩票熊杨,就順手寫了2個(gè)腳本曙旭,一個(gè)用來下載最近的彩票數(shù)據(jù),一個(gè)用來統(tǒng)計(jì)彩票數(shù)字晶府,分享給大家桂躏!
彩票數(shù)據(jù)獲取并寫入excel表格
數(shù)據(jù)來源自己看吧~用外鏈通不過。川陆。剂习。
所用庫(kù):xlwt,requests较沪,lxml
有幾點(diǎn)需要注意的:
1鳞绕、構(gòu)建列表。因?yàn)榇嫒雃xcel文件的時(shí)候用的是列表尸曼,所以新建一個(gè)函數(shù)们何,分別取網(wǎng)頁5個(gè)數(shù)據(jù):時(shí)間、期數(shù)骡苞、開獎(jiǎng)數(shù)123垂蜗,然后每一頁嵌套寫入列表類似結(jié)構(gòu)為[[時(shí)間楷扬、期數(shù)、開獎(jiǎng)數(shù)1贴见,2烘苹,3],[時(shí)間、期數(shù)片部、開獎(jiǎng)數(shù)1镣衡,2,3]……]档悠,在循環(huán)頁數(shù)廊鸥,獲取所有的數(shù)據(jù)!注意構(gòu)建列表的形式和列表結(jié)果辖所,這個(gè)在你寫入表格的時(shí)候很重要惰说!
2、寫入數(shù)據(jù)缘回。xlwt寫入文件的方法為ws.write(行吆视,列,數(shù)據(jù))酥宴,按行寫入文件啦吧,所以新建一個(gè)變量line(代碼第36行),每寫入一行自增1拙寡。
其他方面都很簡(jiǎn)單授滓,沒有反爬,就是為了獲取數(shù)據(jù)肆糕,好做分析般堆!
最后excel表中的數(shù)據(jù)是這樣的:
最后大概有4840行數(shù)據(jù),足夠我們分析的了擎宝!
數(shù)據(jù)處理
用xlrd庫(kù)就可以~話說xlwt庫(kù)和xlrd庫(kù)好像就是一個(gè)寫數(shù)據(jù)郁妈,一個(gè)讀數(shù)據(jù)。绍申。噩咪。
就寫了一個(gè)抓熱門數(shù)字的,也就是取頻率最高的极阅。如果您有更好的想法或者玩法胃碾,可以自行去實(shí)現(xiàn)哦!
先讀取數(shù)據(jù)筋搏,然后取到每一行的2.3.4列仆百,每一列寫入一個(gè)列表(現(xiàn)在有些后悔,不該寫那么多數(shù)據(jù)進(jìn)來),然后3個(gè)列表合并一個(gè)總列表奔脐,這樣我們就有了4個(gè)列表俄周,取出每一個(gè)列表中出現(xiàn)次數(shù)最多的那個(gè)數(shù)字吁讨,代碼如下:
第1個(gè)數(shù)字頻率最高的是 [3]
第2個(gè)數(shù)字頻率最高的是 [6]
第3個(gè)數(shù)字頻率最高的是 [8]
單個(gè)數(shù)字頻率最高的是 [3]
因?yàn)橼s時(shí)間下班。峦朗。就全部用了列表推導(dǎo)式建丧,也沒有用pandas庫(kù)或者可視化庫(kù)做出很炫酷的圖表,等我研究出完美的預(yù)測(cè)方案的時(shí)候在做【手動(dòng)哭泣】波势,不過依現(xiàn)在的趨勢(shì)翎朱,是沒什么希望了。尺铣。拴曲。
最后要說的是,從開始研究分析各種數(shù)據(jù)到現(xiàn)在習(xí)慣性的買彩票凛忿,沒中過大獎(jiǎng)(超過200的都算大獎(jiǎng))澈灼!果然童話都是騙人的……還是學(xué)python比較好玩!