課時(shí)11

select 函數(shù)返回的數(shù)據(jù)是列表，即使它只有一個(gè)攘宙。

1.jpg

那么當(dāng)我們只采集單頁(yè)面不想用 for 賦值 zip() 的時(shí)候我們就需要對(duì)該列表里面的函數(shù)進(jìn)行選擇坦弟。

title = soup.select('div.pho_info > h4')[0].text

這里面是選擇第一項(xiàng) 然后對(duì)他取文本的意思。

而這里面為什么選擇 div.pho_info > h4 是因?yàn)?這是里標(biāo)題最近的單獨(dú) 純?cè)诤谜业?一個(gè)層級(jí)裆操。

1.jpg

在具體頁(yè)面里面怒详，一般向獲取的元素都是在自己?jiǎn)为?dú)的一個(gè)div 或者樣式里面，而在這里面我們獲取自己想要的元素就是通過(guò) 找到要獲取元素所在div 踪区，然后再找他的樣式結(jié)構(gòu)昆烁。

address = soup.select('div.pho_info > p')[0].get('title')

1.jpg

這里面的返回值，用什么來(lái)接就返回到哪里缎岗。

1.jpg

要爬取具體內(nèi)容頁(yè)面時(shí) 首先就要得到他的具體鏈接地址静尼，而具體鏈接地址是放在列表頁(yè)面的，那么我們就需要一個(gè)函數(shù)來(lái)爬取列表頁(yè)面传泊，然后把獲取到的內(nèi)容頁(yè)面鏈接放入到一個(gè)空列表里面鼠渺。

從列表頁(yè)面獲取到內(nèi)容的鏈接，那么我們就要找這些內(nèi)容鏈接有什么相同的屬性眷细，這里面找到的是
resule_img_a

1.jpg

這個(gè)標(biāo)簽是存在于a 標(biāo)簽里面的拦盹，
所以寫為，a.resule_img_a

soup.select('a.resule_img_a'):

自己在學(xué)了這之后有一點(diǎn)感覺(jué)不一樣但又說(shuō)不出來(lái)這和之前的篩選又有什么區(qū)別溪椎，于是努力回想如果按照之前的篩選方法一般都是在要選的鏈接上普舆，右鍵復(fù)制 selector 然后在看要獲取的屬性。

1.jpg

直接一步添加自己要爬的內(nèi)容頁(yè)面

1.jpg

我的代碼

from bs4 import BeautifulSoupimport requestsurl = 'http://bj.xiaozhu.com/fangzi/1508951935.html'wb_data = requests.get(url)soup = BeautifulSoup(wb_data.text,'lxml')title = soup.select('div.pho_info > h4')[0].textaddress = soup.select('body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > p')[0].get('title')price = soup.select('#pricePart > div.day_l > span')[0].textpic = soup.select('#imgMouseCusor')[0].get('src')host_name = soup.select('#floatRightBox > div.js_box.clearfix > div.w_240 > h6 > a')[0].get('title')# host_gender = soup.select('div.member_pic > div')[0].get('class')[0]host_gender = soup.select('#floatRightBox > div.js_box.clearfix > div.w_240 > h6 > span')[0].get('class')[0]def get_gender(gender):    if gender == 'member_girl_ico':        return '女'    if gender == 'member_boy_ico':        return '男'get_gender('member_girl_ico')data = {    'title':title,    'address':address,    'price':price,    'pic':pic,    'host_name':host_name,    'host_gender':get_gender(host_gender)}print(data)page_link = []def get_page_link(page_number):    for each_number in range(1,page_number):        full_url = 'http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(each_number)        wb_data = requests.get(full_url)        soup = BeautifulSoup(wb_data.text,'lxml')        for link in soup.select('a.resule_img_a'):            page_link.append(link)

最后編輯于：2017.12.03 05:21:07

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末校读，一起剝皮案震驚了整個(gè)濱河市沼侣，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌歉秫，老刑警劉巖华临，帶你破解...
沈念sama閱讀 210,978評(píng)論 6贊 490
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異端考，居然都是意外死亡雅潭，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 89,954評(píng)論 2贊 384
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門却特，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)扶供，“玉大人，你說(shuō)我怎么就攤上這事裂明〈慌ǎ” “怎么了？”我有些...
開(kāi)封第一講書人閱讀 156,623評(píng)論 0贊 345
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)扳碍。經(jīng)常有香客問(wèn)我提岔，道長(zhǎng)，這世上最難降的妖魔是什么笋敞？我笑而不...
開(kāi)封第一講書人閱讀 56,324評(píng)論 1贊 282
?港島之戀（遺憾婚禮）
正文為了忘掉前任碱蒙，我火速辦了婚禮，結(jié)果婚禮上夯巷，老公的妹妹穿的比我還像新娘赛惩。我一直安慰自己，他們只是感情好趁餐，可當(dāng)我...
茶點(diǎn)故事閱讀 65,390評(píng)論 5贊 384
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布喷兼。她就那樣靜靜地躺著，像睡著了一般后雷。火紅的嫁衣襯著肌膚如雪季惯。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書人閱讀 49,741評(píng)論 1贊 289
城市分裂傳說(shuō)
那天臀突，我揣著相機(jī)與錄音勉抓，去河邊找鬼。笑死惧辈，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的磕瓷。我是一名探鬼主播盒齿，決...
沈念sama閱讀 38,892評(píng)論 3贊 405
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼困食！你這毒婦竟也來(lái)了边翁？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書人閱讀 37,655評(píng)論 0贊 266
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤硕盹，失蹤者是張志新（化名）和其女友劉穎符匾，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體瘩例，經(jīng)...
沈念sama閱讀 44,104評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡啊胶，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,451評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了垛贤。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片焰坪。...
茶點(diǎn)故事閱讀 38,569評(píng)論 1贊 340
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖聘惦，靈堂內(nèi)的尸體忽然破棺而出某饰，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 34,254評(píng)論 4贊 328
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布黔漂，位于F島的核電站诫尽，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏炬守。R本人自食惡果不足惜牧嫉，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,834評(píng)論 3贊 312
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望劳较。院中可真熱鬧驹止，春花似錦、人聲如沸观蜗。這莊子的主人今日做“春日...
開(kāi)封第一講書人閱讀 30,725評(píng)論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)墓捻。三九已至抖仅，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間砖第，已是汗流浹背撤卢。一陣腳步聲響...
開(kāi)封第一講書人閱讀 31,950評(píng)論 1贊 264
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留梧兼，地道東北人放吩。一個(gè)月前我還...
沈念sama閱讀 46,260評(píng)論 2贊 360
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像羽杰，于是被迫代替她去往敵國(guó)和親渡紫。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,446評(píng)論 2贊 348

課時(shí)11

推薦閱讀更多精彩內(nèi)容