Python實(shí)戰(zhàn)計(jì)劃week1_3項(xiàng)目

python實(shí)戰(zhàn)計(jì)劃的第三個(gè)項(xiàng)目:爬取租房信息魔吐。

最終結(jié)果如下:

one_three.png

其中包括9張頁面弯汰,每張頁面包含24間房,共計(jì)216間房間窗宦,即216條數(shù)據(jù)逃贝。
每條數(shù)據(jù)包含7項(xiàng)信息谣辞,分別是:標(biāo)題迫摔、地址沐扳、日租金、第一張房間圖片鏈接句占、房東圖片鏈接沪摄、房東性別和房東名稱。

代碼如下:

import requests
from bs4 import BeautifulSoup
import time


def get_links(url):
    wb_data = requests.get(url)
    soup = BeautifulSoup(wb_data.text, 'lxml')
    links = soup.select('#page_list > ul > li > a')
    for link in links:
        href = link.get('href')
        one(href)


def if_sex(sexname):
    if sexname == ['member_girl_ico']:
        return '女'
    elif sexname == ['member_boy_ico']:
        return '男'
    else:
        return '沒填寫'


def one(url, data=None):
    wb_data = requests.get(url)
    soup = BeautifulSoup(wb_data.text, 'lxml')
    titles = soup.select('div.pho_info > h4 > em')
    addres = soup.select('div.pho_info > p > span.pr5')
    prices = soup.select('#pricePart > div.day_l > span')
    images = soup.select('#curBigImage')
    pictures = soup.select('#floatRightBox > div.js_box.clearfix > div.member_pic > a > img')
    sexes = soup.select('#floatRightBox > div.js_box.clearfix > div.w_240 > h6 > span')
    names = soup.select('#floatRightBox > div.js_box.clearfix > div.w_240 > h6 > a')
    # print(titles,addres,prices,pictures,names)
    if (data == None):
        for title, addre, price, picture, name, sex, image in zip(titles, addres, prices, pictures, names, sexes,
                                                                  images):
            data = {
                'title': title.get_text(),
                'addre': addre.get_text().replace('\n', '').replace(' ', ''),
                'price': price.get_text(),
                'picture': picture.get('src'),
                'name': name.get_text(),
                'sex': if_sex(sex.get('class')),
                'image': image.get('src')
            }
            print(data)


urls = ['http://wh.xiaozhu.com/search-duanzufang-p{}-0/?startDate=2016-07-17&endDate=2016-08-24'.format(i) for i in
        range(1, 10)]

for url in urls:
    get_links(url)
    time.sleep(2)

總結(jié):

1.一個(gè)大的任務(wù)盡可能的拆分成小的任務(wù)纱烘,并注意每一塊的輸入條件與輸出信息杨拐。
2.replace('a','b'),replace方法,用b替換a擂啥。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末哄陶,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子哺壶,更是在濱河造成了極大的恐慌屋吨,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,104評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件山宾,死亡現(xiàn)場離奇詭異至扰,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)资锰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門敢课,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人绷杜,你說我怎么就攤上這事直秆。” “怎么了鞭盟?”我有些...
    開封第一講書人閱讀 168,697評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵圾结,是天一觀的道長。 經(jīng)常有香客問我懊缺,道長疫稿,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,836評(píng)論 1 298
  • 正文 為了忘掉前任鹃两,我火速辦了婚禮遗座,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘俊扳。我一直安慰自己途蒋,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,851評(píng)論 6 397
  • 文/花漫 我一把揭開白布馋记。 她就那樣靜靜地躺著号坡,像睡著了一般懊烤。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上宽堆,一...
    開封第一講書人閱讀 52,441評(píng)論 1 310
  • 那天腌紧,我揣著相機(jī)與錄音,去河邊找鬼畜隶。 笑死壁肋,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的籽慢。 我是一名探鬼主播浸遗,決...
    沈念sama閱讀 40,992評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼箱亿!你這毒婦竟也來了跛锌?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,899評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤届惋,失蹤者是張志新(化名)和其女友劉穎髓帽,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體盼樟,經(jīng)...
    沈念sama閱讀 46,457評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡氢卡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,529評(píng)論 3 341
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了晨缴。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片译秦。...
    茶點(diǎn)故事閱讀 40,664評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖击碗,靈堂內(nèi)的尸體忽然破棺而出筑悴,到底是詐尸還是另有隱情,我是刑警寧澤稍途,帶...
    沈念sama閱讀 36,346評(píng)論 5 350
  • 正文 年R本政府宣布阁吝,位于F島的核電站,受9級(jí)特大地震影響械拍,放射性物質(zhì)發(fā)生泄漏突勇。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,025評(píng)論 3 334
  • 文/蒙蒙 一坷虑、第九天 我趴在偏房一處隱蔽的房頂上張望甲馋。 院中可真熱鬧,春花似錦迄损、人聲如沸定躏。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,511評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽痊远。三九已至垮抗,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間碧聪,已是汗流浹背冒版。 一陣腳步聲響...
    開封第一講書人閱讀 33,611評(píng)論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留矾削,地道東北人壤玫。 一個(gè)月前我還...
    沈念sama閱讀 49,081評(píng)論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像哼凯,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子楚里,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,675評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,303評(píng)論 25 707
  • 發(fā)現(xiàn) 關(guān)注 消息 iOS 第三方庫断部、插件、知名博客總結(jié) 作者大灰狼的小綿羊哥哥關(guān)注 2017.06.26 09:4...
    肇東周閱讀 12,121評(píng)論 4 61
  • 導(dǎo)讀:大寒是寒冷冬天的最后一個(gè)節(jié)氣班缎,也是農(nóng)歷的最后一個(gè)節(jié)氣蝴光。在此期間,雪达址,雨和冰冷天氣會(huì)對(duì)人們的生活產(chǎn)生非常大的影...
    bc0560096e54閱讀 567評(píng)論 0 2
  • 人生如畫沉唠,其實(shí)疆虚,畫亦如人生。 現(xiàn)在的生活節(jié)奏太快满葛,我們的腳步更是如此径簿。 有時(shí)候,停下來嘀韧,靜靜地拿起筆篇亭,畫一幅畫,真...
    苳小汀閱讀 1,452評(píng)論 8 19
  • 時(shí)光荏苒锄贷,白駒過隙译蒂,一轉(zhuǎn)眼的工夫,我也已從去年什么也不懂的萌新鮮肉變成了今天的臘肉學(xué)長谊却,從去年對(duì)大學(xué)一切事物都很...
    1874福祿閱讀 604評(píng)論 0 0