python爬蟲(chóng):爬取房源數(shù)據(jù)

from bs4 import BeautifulSoup
import requests
import time
import pymongo

client = pymongo.MongoClient('localhost',27017)
walden = client['walden']
sheet_tab = walden['sheet_tab']

url = 'https://m.lianjia.com/bj/zufang/101102453003.html'
urls = ['https://m.lianjia.com/bj/zufang/pg{}'.format(str(i)) for i in range(1,3)]

def get_houses(url,data=None):
    wb_data = requests.get(url)
    soup = BeautifulSoup(wb_data.text, 'lxml')

    time.sleep(2) #防止請(qǐng)求過(guò)于頻繁被反爬蟲(chóng)

    titles = soup.select('div.item_list > div.item_main')
    adds = soup.select('div.item_list > div.item_other.text_cut')
    prices = soup.select('div.item_list > div.item_minor > span > em')
    imgs = soup.select('div.mod_media > div > img')
    for title,img,add,price in zip(titles,imgs,adds,prices):
        data = {
            'title':title.get_text(),
            'img':img.get('origin-src'),
            'add':add.get_text(),
            'price':price.get_text(),
        }
        sheet_tab.insert_one(data)

for single_url in urls:
    get_houses(single_url)

#輸出所有價(jià)格大于5000的數(shù)據(jù)
# for info in sheet_tab.find():
#     if int(info['price']) > 5000:
#         print(info)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末芯杀,一起剝皮案震驚了整個(gè)濱河市提揍,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌悼泌,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,997評(píng)論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡哮塞,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,603評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)斥铺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)彻桃,“玉大人坛善,你說(shuō)我怎么就攤上這事晾蜘×诰欤” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,359評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵剔交,是天一觀的道長(zhǎng)肆饶。 經(jīng)常有香客問(wèn)我,道長(zhǎng)岖常,這世上最難降的妖魔是什么驯镊? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,309評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮竭鞍,結(jié)果婚禮上板惑,老公的妹妹穿的比我還像新娘。我一直安慰自己偎快,他們只是感情好冯乘,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,346評(píng)論 6 390
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著晒夹,像睡著了一般裆馒。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上丐怯,一...
    開(kāi)封第一講書(shū)人閱讀 51,258評(píng)論 1 300
  • 那天喷好,我揣著相機(jī)與錄音,去河邊找鬼读跷。 笑死梗搅,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的舔亭。 我是一名探鬼主播些膨,決...
    沈念sama閱讀 40,122評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼钦铺!你這毒婦竟也來(lái)了订雾?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 38,970評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤矛洞,失蹤者是張志新(化名)和其女友劉穎洼哎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體沼本,經(jīng)...
    沈念sama閱讀 45,403評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡噩峦,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,596評(píng)論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了抽兆。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片识补。...
    茶點(diǎn)故事閱讀 39,769評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖辫红,靈堂內(nèi)的尸體忽然破棺而出凭涂,到底是詐尸還是另有隱情祝辣,我是刑警寧澤,帶...
    沈念sama閱讀 35,464評(píng)論 5 344
  • 正文 年R本政府宣布切油,位于F島的核電站蝙斜,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏澎胡。R本人自食惡果不足惜孕荠,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,075評(píng)論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望攻谁。 院中可真熱鬧稚伍,春花似錦、人聲如沸戚宦。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,705評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)阁苞。三九已至困檩,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間那槽,已是汗流浹背悼沿。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,848評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留骚灸,地道東北人糟趾。 一個(gè)月前我還...
    沈念sama閱讀 47,831評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像甚牲,于是被迫代替她去往敵國(guó)和親义郑。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,678評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容