#main.py
import requests
import json
import pymongo
from multiprocessing import Pool
import time
import random
url = 'https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false'
headers = {
'Accept':'application/json, text/javascript, */*; q=0.01',
'Accept-Encoding':'gzip, deflate',
'Accept-Language':'zh-CN,zh;q=0.8',
'Connection':'keep-alive',
'Content-Length':'65',
'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8',
'Cookie':'',
'Host':'www.lagou.com',
'Origin':'https://www.lagou.com',
'Referer':'https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E5%B8%88?px=default&city=%E5%85%A8%E5%9B%BD',
'User-Agent':'Mozilla/5.0 (Windows NT 6.2; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.130 Safari/537.36',
'X-Anit-Forge-Code':'0',
'X-Anit-Forge-Token':'None',
'X-Requested-With':'XMLHttpRequest'
}
def postonepage(pn):
client = pymongo.MongoClient('localhost', 27017)
Lagou = client['Lagou']
position = Lagou['position']
print(pn)
postdata = {
'first': 'false',
'pn': pn,
'kd': '數(shù)據(jù)分析師'
}
try:
wbdata = requests.post(url,headers = headers,data = postdata)
jdata = wbdata.json()
# print(jdata)
positionResult = jdata['content']['positionResult']
time.sleep(random.randint(4, 8))
# print(positionResult)
for j in positionResult:
i = j['position']
adata = {
'createTime':i['createTime'],
'positionId': i['positionId'],
'positionName':i['positionName'],
'firstType':i['firstType'],
'secondType':i['secondType'],
'education':i['education'],
'city':i['city'],
'salary':i['salary'],
'jobNature':i['jobNature'],
'workYear':i['workYear'],
'companyId':i['companyId'],
'companyFullName':i['companyFullName'],
'financeStage':i['financeStage'],
'companySize':i['companySize'],
'industryField':i['industryField']
}
position.insert_one(adata)
print('success')
except:
print('one error occurred')
if __name__ == '__main__':
alist = list(range(1,500))
pool = Pool(processes=4)
pool.map(postonepage,alist)
爬蟲:拉勾職位
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
- 文/潘曉璐 我一進(jìn)店門瓮床,熙熙樓的掌柜王于貴愁眉苦臉地迎上來盹舞,“玉大人,你說我怎么就攤上這事隘庄√卟剑” “怎么了?”我有些...
- 文/不壞的土叔 我叫張陵丑掺,是天一觀的道長(zhǎng)获印。 經(jīng)常有香客問我,道長(zhǎng)街州,這世上最難降的妖魔是什么兼丰? 我笑而不...
- 正文 為了忘掉前任,我火速辦了婚禮唆缴,結(jié)果婚禮上鳍征,老公的妹妹穿的比我還像新娘。我一直安慰自己面徽,他們只是感情好艳丛,可當(dāng)我...
- 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著趟紊,像睡著了一般质礼。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上织阳,一...
- 文/蒼蘭香墨 我猛地睜開眼嵌器,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了谐丢?” 一聲冷哼從身側(cè)響起爽航,我...
- 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎乾忱,沒想到半個(gè)月后讥珍,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
- 正文 獨(dú)居荒郊野嶺守林人離奇死亡窄瘟,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
- 正文 我和宋清朗相戀三年衷佃,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蹄葱。...
- 正文 年R本政府宣布竣况,位于F島的核電站吮螺,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏帕翻。R本人自食惡果不足惜,卻給世界環(huán)境...
- 文/蒙蒙 一萝风、第九天 我趴在偏房一處隱蔽的房頂上張望嘀掸。 院中可真熱鬧,春花似錦规惰、人聲如沸睬塌。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽揩晴。三九已至,卻和暖如春贪磺,著一層夾襖步出監(jiān)牢的瞬間硫兰,已是汗流浹背。 一陣腳步聲響...
- 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像泳赋,于是被迫代替她去往敵國(guó)和親雌桑。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
推薦閱讀更多精彩內(nèi)容
- 主要爬了以下幾個(gè)字段: 崗位名稱 公司名稱 要求的工作經(jīng)驗(yàn) 薪資 工作地點(diǎn)祖今。 感謝羅攀攀和向右奔跑以及朋友wili...
- 上次挖了一個(gè)坑校坑,今天終于填上了,還記得之前我們做的拉勾爬蟲嗎千诬?那時(shí)我們實(shí)現(xiàn)了一頁(yè)的爬取耍目,今天讓我們?cè)俳釉賲枺瑢?shí)現(xiàn)多...
- 簡(jiǎn)介 用node.js寫了一個(gè)簡(jiǎn)單的小爬蟲大渤,用來爬取拉勾網(wǎng)上的招聘信息制妄,共爬取了北京、上海泵三、廣州耕捞、深圳、杭州烫幕、西安...
- 感覺好久沒寫python了哈哈俺抽,最近都在忙工作,所以也是沒有學(xué)習(xí)python较曼。剛好湊巧朋友正在找工作磷斧,也是java...
- 知己知彼弛饭,方可百戰(zhàn)不殆。在學(xué)習(xí)技術(shù)的時(shí)候我們往往面臨太多選擇而不知所措萍歉,可能是各個(gè)方面都有涉獵侣颂,對(duì)某個(gè)領(lǐng)域沒有深入...