爬蟲P2P網(wǎng)站某產(chǎn)品交易數(shù)據(jù)統(tǒng)計分析

前言

通過爬蟲p2p網(wǎng)站某產(chǎn)品交易數(shù)據(jù)蜘腌,分析實(shí)時交易量及增長趨勢,判斷產(chǎn)品活力。

(因不想體現(xiàn)為某p2p網(wǎng)站踏志,所以里面網(wǎng)站地址使用xxxxxx進(jìn)行代替,另代碼可參看最下方的github地址胀瞪。)

目錄

一针余、P2P某產(chǎn)品交易量分析

二、工具及相關(guān)python包

三凄诞、獲取網(wǎng)站的標(biāo)號及交易量并存入本地excel

四圆雁、根據(jù)excel表格中的數(shù)據(jù)進(jìn)行分析統(tǒng)計實(shí)時交易量

五、jenkins配置

六帆谍、效果圖展示如下圖

七伪朽、gitlab源碼地址

一、實(shí)現(xiàn)思路

1汛蝙、提取投標(biāo)項目號

2烈涮、根據(jù)標(biāo)號進(jìn)入分頁進(jìn)行資金收集

3、將交易量輸入excel表格

4窖剑、根據(jù)excel統(tǒng)計出最新的交易總和

二坚洽、工具及相關(guān)python包

python3? Pycharm?urllib?bs4?re?xlrd?xlutils.copy? jenkins

三、獲取網(wǎng)站的標(biāo)號及交易量并存入本地excel

#導(dǎo)入所需要的相關(guān)包

from html.parser import HTMLParser

from urllib import request

from bs4 import BeautifulSoup

import reimport time

import xlrd,xlwt,os,sys,xlutils

from xlrd import open_workbook

from xlutils.copy import copy

#此函數(shù)為獲取網(wǎng)站的標(biāo)號及剩余量

def getdata(data1,data2,data3):

? with request.urlopen(data1) as f:

? ? ? data = f.read().decode('utf-8').replace(u'\xa9', u'') #listp接收標(biāo)號的url進(jìn)行拼接? ?

? ? ? listp = []

? ? ?res_tr = re.findall(r'/Venus/\d+',data)

? ? ?for i in res_tr:

? ? ? ? ? ?listp.append(i)?

? ? listj = []?

? ?listm = []

? #listj接收剩余量 listm接收標(biāo)號

? for j in listp:?

? ?listm.append(j.split('/')[2]) #獲取/標(biāo)號

? ?url = "https://xxxxxxxx.com" + j #拼接標(biāo)號url?

? with request.urlopen(url) as f:? ? ? ? ? ? ? ?

? ? ? ? ? ? ? data = f.read().decode('utf-8').replace(u'\xa9', u'') #獲取標(biāo)號頁面

? with open(data3, 'w') as f: #標(biāo)號頁面存入data3

? ? ? ? ? ? ?for i in data: f.write(i)

? ? ? ? ? ? soup = BeautifulSoup(open(data3)) #使用BeautifulSoup格式化頁面html

? ? ? ? ? ? jr = (soup.find_all(class_="canbid-amount")) #根據(jù)class標(biāo)簽找到剩余量

? if jr: listj.append(str(jr[0]).split('')[1].split('')[0]) #切割剩余量獲取數(shù)據(jù)

? else: listj.append("收益中") #無剩余量顯示? ?

? ?dictjm = dict(zip(listm, listj)) #剩余量 標(biāo)號存入字典dictjm

? ?return dictjm #返回

def sendexcl(url,getjm):

? ? ? rexcel = open_workbook(url) #打開excel

? ? ? rows = rexcel.sheets()[0].nrows #統(tǒng)計行

? ? ? cols = rexcel.sheets()[0].ncols #統(tǒng)計列

? ? ? excel = copy(rexcel) #復(fù)制表

? ? ? table = excel.get_sheet(0) #第一張表

? ? ? j = 0

? ? ?for i, m in getjm.items(): #字典讀取數(shù)據(jù)excel寫入標(biāo)號

? ? ? ? ? ? ? ? ? table.write(rows, j, i) #第一張表行寫入數(shù)據(jù)j用于定位行列 i為插入數(shù)據(jù)

? ? ? ? ? ? ? ? ? ?j += 1 #列后移一位

? ? ?rows += 1 #行后移一位

? ? ?excel.save(url) #保存數(shù)據(jù)

? ? ?j = 0

? ? for i, m in getjm.items(): #excel寫入剩余量

? ? ? ? ? ? ? ? table.write(rows, j, m)

? ? ? ? ? ? ? ? j += 1

? ?rows += 1

? ?excel.save(url)

getjm = getdata("https://xxxxxxxxxxxxxx","jmgetlog","jmget1log") #獲取剩余量標(biāo)號字典sendexcl("F:\JIMU\JMQST.xlsx",getjm) #excel存入字典

四西土、根據(jù)excel表格中的數(shù)據(jù)進(jìn)行分析統(tǒng)計實(shí)時交易量

import xlrd

data = xlrd.open_workbook("F:\JIMU\JMQST.xlsx")

table = data.sheets()[0] # 第幾個sheet

nrows = table.nrows # 行數(shù)

ncols = table.ncols # 列數(shù)

colnames = table.row_values(1) # 某一行數(shù)據(jù)

print(colnames)

colnames2 = table.row_values(nrows-1)

print(colnames2)

dictn = dict(zip(colnames,colnames2))

del dictn["收益中"]

print(dictn)

listn = []

for i,j in dictn.items():

? ? ? ? ? i = i.replace(',','')

? ? ? ? ? j = j.replace(',','')

? ? ? ? ? m = float(i) - float(j)

? ? ? ? ? listn.append(m)

print(listn)

m = 0

for i in listn:

? ? ? ?m += i

? ? ? print(m)

? ? ? print("輕松投減少量為:%f"%(m))

with open('F:\JIMU\pylog', 'a+') as f:

? ? ? ?f.write('\n')

? ? ? ?f.write(str(m))

? ? ? ?print("sucessful ok")

五讶舰、jenkins配置

圖一為jenkins定時任務(wù)配置兩分鐘進(jìn)行一次

圖二為jenkins python配置 jimuDA3.py獲取實(shí)時交易量 test1.py 統(tǒng)計交易總


圖一定時任務(wù)
圖二jenkins配置截圖

六、效果圖展示如下圖

圖三交易量收集輸入excel表格

圖四 根據(jù)excel表格數(shù)據(jù)統(tǒng)計出實(shí)時的交易量需了,兩分鐘統(tǒng)計一次跳昼,由圖可見最新總交易量為一千一百余萬

圖三excel截圖


圖四交易總額

七、github地址

https://github.com/tanghuan123/getdata

https://github.com/tanghuan123/getdata/blob/master/getjmdata.py

https://github.com/tanghuan123/getdata/blob/master/test1.py



最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末援所,一起剝皮案震驚了整個濱河市庐舟,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌住拭,老刑警劉巖挪略,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件历帚,死亡現(xiàn)場離奇詭異,居然都是意外死亡杠娱,警方通過查閱死者的電腦和手機(jī)挽牢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來摊求,“玉大人禽拔,你說我怎么就攤上這事∈也妫” “怎么了睹栖?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長茧痕。 經(jīng)常有香客問我野来,道長,這世上最難降的妖魔是什么踪旷? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任曼氛,我火速辦了婚禮,結(jié)果婚禮上令野,老公的妹妹穿的比我還像新娘舀患。我一直安慰自己,他們只是感情好气破,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布聊浅。 她就那樣靜靜地躺著,像睡著了一般现使。 火紅的嫁衣襯著肌膚如雪狗超。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天朴下,我揣著相機(jī)與錄音,去河邊找鬼苦蒿。 笑死殴胧,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的佩迟。 我是一名探鬼主播团滥,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼报强!你這毒婦竟也來了灸姊?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤秉溉,失蹤者是張志新(化名)和其女友劉穎力惯,沒想到半個月后碗誉,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡父晶,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年哮缺,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片甲喝。...
    茶點(diǎn)故事閱讀 38,018評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡尝苇,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出埠胖,到底是詐尸還是另有隱情糠溜,我是刑警寧澤,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布直撤,位于F島的核電站非竿,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏谊惭。R本人自食惡果不足惜汽馋,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望圈盔。 院中可真熱鬧豹芯,春花似錦、人聲如沸驱敲。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽众眨。三九已至握牧,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間娩梨,已是汗流浹背沿腰。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留狈定,地道東北人颂龙。 一個月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像纽什,于是被迫代替她去往敵國和親措嵌。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,762評論 2 345

推薦閱讀更多精彩內(nèi)容

  • 今天以一張照片開始芦缰,因?yàn)橄肓税胩觳胚M(jìn)入狀態(tài)企巢。依然從下班到家開始記錄…… 到家以后他激動的告訴我他是壞蛋,爺爺是警察...
    幽香_5126閱讀 262評論 0 1
  • 原創(chuàng)/蘋兒(茵草芳菲) 葉卡捷琳娜女皇傳奇的一生让蕾,我充滿好奇浪规,她是俄羅斯歷史上或听,唯一一位與彼得大帝齊名的凱瑟琳大帝...
    茵草芳菲閱讀 2,264評論 21 25
  • 因果調(diào)查設(shè)計即實(shí)驗(yàn)法。實(shí)驗(yàn)法是一種特殊的調(diào)查方法罗丰,通過所設(shè)定的特殊實(shí)驗(yàn)場所以及特殊狀態(tài)神帅,對調(diào)查對象進(jìn)行實(shí)驗(yàn)以獲得所...
    2b97f9b072f6閱讀 510評論 0 0