from bs4 import BeautifulSoup
import requests
url = 'http://bj.xiaozhu.com/fangzi/1508951935.html'
wb_data = requests.get(url)
soup = BeautifulSoup(wb_data.text,'lxml')
title = soup.select('div.pho_info > h4')[0].text
address = soup.select('body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > p')[0].get('title')
price = soup.select('#pricePart > div.day_l > span')[0].text
pic = soup.select('#imgMouseCusor')[0].get('src')
host_name = soup.select('#floatRightBox > div.js_box.clearfix > div.w_240 > h6 > a')[0].get('title')
# host_gender = soup.select('div.member_pic > div')[0].get('class')[0]
host_gender = soup.select('#floatRightBox > div.js_box.clearfix > div.w_240 > h6 > span')[0].get('class')[0]
def get_gender(gender):
if gender == 'member_girl_ico':
return '女'
if gender == 'member_boy_ico':
return '男'
get_gender('member_girl_ico')
data = {
'title':title,
'address':address,
'price':price,
'pic':pic,
'host_name':host_name,
'host_gender':get_gender(host_gender)
}
print(data)
page_link = []
def get_page_link(page_number):
for each_number in range(1,page_number):
full_url = 'http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(each_number)
wb_data = requests.get(full_url)
soup = BeautifulSoup(wb_data.text,'lxml')
for link in soup.select('a.resule_img_a'):
page_link.append(link)
一周作業(yè)3 爬取租房信息
最后編輯于 :
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
- 文/潘曉璐 我一進店門胚膊,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人想鹰,你說我怎么就攤上這事紊婉。” “怎么了杖挣?”我有些...
- 文/不壞的土叔 我叫張陵,是天一觀的道長刚陡。 經(jīng)常有香客問我惩妇,道長,這世上最難降的妖魔是什么筐乳? 我笑而不...
- 正文 為了忘掉前任歌殃,我火速辦了婚禮,結果婚禮上蝙云,老公的妹妹穿的比我還像新娘氓皱。我一直安慰自己,他們只是感情好勃刨,可當我...
- 文/花漫 我一把揭開白布波材。 她就那樣靜靜地躺著,像睡著了一般身隐。 火紅的嫁衣襯著肌膚如雪廷区。 梳的紋絲不亂的頭發(fā)上,一...
- 文/蒼蘭香墨 我猛地睜開眼斑匪,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了锋勺?” 一聲冷哼從身側響起秤标,我...
- 正文 年R本政府宣布,位于F島的核電站订咸,受9級特大地震影響曼尊,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜脏嚷,卻給世界環(huán)境...
- 文/蒙蒙 一骆撇、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧父叙,春花似錦神郊、人聲如沸。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至甜癞,卻和暖如春爷怀,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背带欢。 一陣腳步聲響...
推薦閱讀更多精彩內(nèi)容
- 實現(xiàn)了從租房網(wǎng)站爬取信息的功能下面是效果圖 總結 有時候并不是單純的獲取txt信息,需要根據(jù)其內(nèi)容判斷正確的內(nèi)容 ...
- 實戰(zhàn)計劃0430-石頭的練習作業(yè) 練習的要求 實現(xiàn)效果如下 相關代碼 筆記、想法纺讲、總結 1擂仍、這個代碼是之前寫的了,...
- 運行結果: 我的代碼: 我的感想: 用時接近3個小時(⊙o⊙)… 真的很怕運行到第100多條的時候報錯(多謝群友提...
- 成果: 任務: Level 1爬取網(wǎng)頁:http://sh.xiaozhu.com/fangzi/16503455...