PYTHON實(shí)戰(zhàn)計(jì)劃練手項(xiàng)目3--爬取租房信息

相比昨天晋被,對(duì)BeautifulSoup的使用熟練了點(diǎn)兑徘,但各方法的理解還是不夠,會(huì)對(duì)list進(jìn)行g(shù)et_text()方法墨微,在這里繞了不少圈子道媚,另外扁掸,爬取網(wǎng)頁(yè)的時(shí)候還是要加深對(duì)HTML和CSS的理解才能更好的找到篩選出所需信息的條件翘县,不管怎么,順利完成練手項(xiàng)目谴分。

結(jié)果展示

Paste_Image.png

我的代碼

from bs4 import BeautifulSoup
import requests
import time

#獲取詳情頁(yè)鏈接
def get_url_xz(n=1):  #通過(guò)參數(shù)n來(lái)控制爬取的頁(yè)數(shù)锈麸,默認(rèn)為一頁(yè)
    urls_list = ['http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(str(i)) for i in range(1, n+1)]  # 列表頁(yè)鏈接列表
    urls_attr = []  # 詳情頁(yè)鏈接列表
    #通過(guò)for循環(huán),把列表頁(yè)的詳情頁(yè)鏈接加入urls_attr
    for url_single in urls_list:
        wb_data = requests.get(url_single)
        time.sleep(2)
        soup = BeautifulSoup(wb_data.text, 'lxml')
        urls = soup.select('div#page_list > ul > li > a[target="_blank"]')
        for url in urls:
            urls_attr.append(url.get('href'))
    return urls_attr

#爬取詳情頁(yè)數(shù)據(jù)
def get_attractions_xz(url,data=None):
    for each_url in url:
        wb_data = requests.get(each_url)  # 獲取頁(yè)面內(nèi)容
        time.sleep(2)
        soup = BeautifulSoup(wb_data.text, 'lxml')
        # print(soup)
        # 獲取目標(biāo)信息
        title = soup.select('div.pho_info > h4 > em')              # 標(biāo)題
        address = soup.select('div.pho_info > p > span')           # 地址
        price = soup.select('div.day_l > span')                    # 價(jià)格
        pic_fd = soup.select('div.member_pic > a > img')           # 房東照片
        name = soup.select('div.w_240 > h6 > a')                   # 房東姓名
        sex = soup.select('div.w_240 > h6')                        # 房東性別
        img = soup.select('div.pho_show_big > div > img')          # 第一張圖片鏈接
        # print(titls,address,price,pic_fangdong,name,sex,img)

        # 據(jù)分析牺蹄,若房東為男性忘伞,則用的CSS為'member_boy_ico',否則為女性沙兰,通過(guò)條件判斷為sex賦值
        if len(sex[0].find_all("span", class_="member_boy_ico")):
            sex = 'Male'  # 男性
        else:
            sex = 'Female'  # 女性
        data = {
            'title': title[0].get_text(),
            'addres': address[0].get_text().split('\n')[0],  # 地址中包含換行符及一行空格氓奈,通過(guò)分割,只保留地址部分
            'price': '¥' + price[0].get_text(),
            'pic_fd': pic_fd[0].get('src'),
            'name': name[0].get("title"),  # 房東姓名在title屬性中鼎天,用get方法獲取
            'sex': sex,
            'img': img[0].get('src')
        }
        print(data)

url=get_url_xz(n=3) #獲取3頁(yè)的所有詳情頁(yè)鏈接,頁(yè)數(shù)可自由選擇
get_attractions_xz(url)



總結(jié)

1.在寫代碼的過(guò)程中舀奶,網(wǎng)頁(yè)的樣式發(fā)生了變化,房東信息那部分發(fā)生了變化斋射,重寫這部分代碼育勺;
2.運(yùn)行效率有點(diǎn)慢但荤,可能是sleep的原因,后面再研究一下涧至;
3.要加深對(duì)網(wǎng)頁(yè)的了解腹躁,前面分析時(shí)間耗時(shí)有點(diǎn)久。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末南蓬,一起剝皮案震驚了整個(gè)濱河市纺非,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌赘方,老刑警劉巖铐炫,帶你破解...
    沈念sama閱讀 216,692評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異蒜焊,居然都是意外死亡倒信,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,482評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門泳梆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)鳖悠,“玉大人,你說(shuō)我怎么就攤上這事优妙〕俗郏” “怎么了?”我有些...
    開封第一講書人閱讀 162,995評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵套硼,是天一觀的道長(zhǎng)卡辰。 經(jīng)常有香客問(wèn)我,道長(zhǎng)邪意,這世上最難降的妖魔是什么九妈? 我笑而不...
    開封第一講書人閱讀 58,223評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮雾鬼,結(jié)果婚禮上萌朱,老公的妹妹穿的比我還像新娘。我一直安慰自己策菜,他們只是感情好晶疼,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,245評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著又憨,像睡著了一般翠霍。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蠢莺,一...
    開封第一講書人閱讀 51,208評(píng)論 1 299
  • 那天寒匙,我揣著相機(jī)與錄音,去河邊找鬼浪秘。 笑死蒋情,一個(gè)胖子當(dāng)著我的面吹牛埠况,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播棵癣,決...
    沈念sama閱讀 40,091評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼辕翰,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了狈谊?” 一聲冷哼從身側(cè)響起喜命,我...
    開封第一講書人閱讀 38,929評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎河劝,沒想到半個(gè)月后壁榕,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,346評(píng)論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡赎瞎,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,570評(píng)論 2 333
  • 正文 我和宋清朗相戀三年牌里,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片务甥。...
    茶點(diǎn)故事閱讀 39,739評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡牡辽,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出敞临,到底是詐尸還是另有隱情态辛,我是刑警寧澤,帶...
    沈念sama閱讀 35,437評(píng)論 5 344
  • 正文 年R本政府宣布挺尿,位于F島的核電站奏黑,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏编矾。R本人自食惡果不足惜熟史,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,037評(píng)論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望洽沟。 院中可真熱鬧以故,春花似錦蜗细、人聲如沸裆操。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,677評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)踪区。三九已至,卻和暖如春吊骤,著一層夾襖步出監(jiān)牢的瞬間缎岗,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,833評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工白粉, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留传泊,地道東北人鼠渺。 一個(gè)月前我還...
    沈念sama閱讀 47,760評(píng)論 2 369
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像眷细,于是被迫代替她去往敵國(guó)和親拦盹。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,647評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容