爬蟲:拉勾職位

    #main.py

    import requests
    import json
    import pymongo
    from multiprocessing import Pool
    import time
    import random


    url = 'https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false'
    headers = {
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Encoding':'gzip, deflate',
        'Accept-Language':'zh-CN,zh;q=0.8',
        'Connection':'keep-alive',
        'Content-Length':'65',
        'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8',
        'Cookie':'',
        'Host':'www.lagou.com',
        'Origin':'https://www.lagou.com',
        'Referer':'https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E5%B8%88?px=default&city=%E5%85%A8%E5%9B%BD',
        'User-Agent':'Mozilla/5.0 (Windows NT 6.2; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.130 Safari/537.36',
        'X-Anit-Forge-Code':'0',
        'X-Anit-Forge-Token':'None',
        'X-Requested-With':'XMLHttpRequest'
    }


    def postonepage(pn):
        client = pymongo.MongoClient('localhost', 27017)
        Lagou = client['Lagou']
        position = Lagou['position']
        print(pn)
        postdata = {
            'first': 'false',
            'pn': pn,
            'kd': '數(shù)據(jù)分析師'
        }
        try:
            wbdata = requests.post(url,headers = headers,data = postdata)
            jdata = wbdata.json()
            # print(jdata)
            positionResult = jdata['content']['positionResult']
            time.sleep(random.randint(4, 8))
            # print(positionResult)
            for j in positionResult:
                i = j['position']
                adata = {
                    'createTime':i['createTime'],
                    'positionId': i['positionId'],
                    'positionName':i['positionName'],
                    'firstType':i['firstType'],
                    'secondType':i['secondType'],
                    'education':i['education'],
                    'city':i['city'],
                    'salary':i['salary'],
                    'jobNature':i['jobNature'],
                    'workYear':i['workYear'],

                    'companyId':i['companyId'],
                    'companyFullName':i['companyFullName'],
                    'financeStage':i['financeStage'],
                    'companySize':i['companySize'],
                    'industryField':i['industryField']
                }
                position.insert_one(adata)

            print('success')
        except:
            print('one error occurred')


    if __name__ == '__main__':
        alist = list(range(1,500))
        pool = Pool(processes=4)
        pool.map(postonepage,alist)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖虏辫,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡信峻,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門瓮床,熙熙樓的掌柜王于貴愁眉苦臉地迎上來盹舞,“玉大人,你說我怎么就攤上這事隘庄√卟剑” “怎么了?”我有些...
    開封第一講書人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵丑掺,是天一觀的道長(zhǎng)获印。 經(jīng)常有香客問我,道長(zhǎng)街州,這世上最難降的妖魔是什么兼丰? 我笑而不...
    開封第一講書人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮唆缴,結(jié)果婚禮上鳍征,老公的妹妹穿的比我還像新娘。我一直安慰自己面徽,他們只是感情好艳丛,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著趟紊,像睡著了一般质礼。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上织阳,一...
    開封第一講書人閱讀 51,688評(píng)論 1 305
  • 那天眶蕉,我揣著相機(jī)與錄音,去河邊找鬼唧躲。 笑死造挽,一個(gè)胖子當(dāng)著我的面吹牛碱璃,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播饭入,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼嵌器,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了谐丢?” 一聲冷哼從身側(cè)響起爽航,我...
    開封第一講書人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎乾忱,沒想到半個(gè)月后讥珍,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡窄瘟,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年衷佃,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蹄葱。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡氏义,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出图云,到底是詐尸還是另有隱情惯悠,我是刑警寧澤,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布竣况,位于F島的核電站吮螺,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏帕翻。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一萝风、第九天 我趴在偏房一處隱蔽的房頂上張望嘀掸。 院中可真熱鬧,春花似錦规惰、人聲如沸睬塌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽揩晴。三九已至,卻和暖如春贪磺,著一層夾襖步出監(jiān)牢的瞬間硫兰,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來泰國(guó)打工寒锚, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留劫映,地道東北人违孝。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像泳赋,于是被迫代替她去往敵國(guó)和親雌桑。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容