Python實(shí)戰(zhàn)計(jì)劃 第一周大作業(yè)-58同城

Python實(shí)戰(zhàn)計(jì)劃 第一周大作業(yè)-58同城
要求:
1.爬取頁(yè)面http://bj.58.com/pbdn/0/ 的列表信息(除轉(zhuǎn)轉(zhuǎn)和推廣信息外),然后獲取詳情信息夭咬,如:類目啃炸、標(biāo)題、發(fā)貼時(shí)間卓舵、價(jià)格南用、成色、區(qū)域掏湾、瀏覽量等
2.注意瀏覽量的獲取方法

執(zhí)行結(jié)果:


Paste_Image.png

代碼如下:

from bs4 import BeautifulSoup
import requests
import time

url ='http://bj.58.com/pbdn/0/'
url_links = []
data = []

def get_url(url):
    msg = requests.get(url)
    soup = BeautifulSoup(msg.text, 'lxml')
    links = soup.select('td.t a.t')

    for link in links:
        try:
            if link.attrs['data-addtype']:
                pass
        except:
            if link.attrs['href'].find('zhuanzhuan') >= 0:       #find不拋出異常裹虫,如果用index,則會(huì)拋出異常
                pass
            else:
                #print(link.attrs['href'])
                url_links.append(link.attrs['href'])

def get_msginfo(url):
    print("msginfo:" + url)
    msg = requests.get(url)
    soup = BeautifulSoup(msg.text, 'lxml')

    #類目
    type = soup.select('#header > div.breadCrumb.f12 ')[0].text.split()
    #標(biāo)題
    title = soup.select('#content > div.person_add_top.no_ident_top > div.per_ad_left > div.col_sub.mainTitle > h1')[0].text
    #發(fā)貼時(shí)間
    ftime = soup.select('#index_show > ul.mtit_con_left.fl > li.time')[0].text
    #價(jià)格
    price = soup.select('ul > li > div.su_con > span.price')[0].text
    #成色
    purity = soup.select('ul > li > div.su_con > span')[1].text.strip()
    #區(qū)域
    if len(soup.select('.c_25d')) == 0:
        area = None
    else:
        area = soup.select('.c_25d')[0].text.replace('-', '').split()

    #瀏覽量
    view = get_view(url)

    date = {
        'type':type,
        'title':title,
        'ftime':ftime,
        'price':price,
        'purity':purity,
        'area':area,
        'view':view
    }
    print(date)
    data.append(date)

def get_view(url):
    headers ={
        'Referer':url
    }
    viwe_url = 'http://jst1.58.com/counter?infoid={}'.format(str(url.split('x.shtml')[0].split('/')[-1]))
    msg =  requests.get(viwe_url, headers=headers)
    return msg.text.split('=')[-1]

get_url(url)
for url_link in url_links:
    time.sleep(2)
    get_msginfo(url_link)

總結(jié):
1.通過(guò)一周的學(xué)習(xí),已熟練掌握requests融击、bs4庫(kù)的使用恒界,學(xué)會(huì)了網(wǎng)頁(yè)要素的提取,能用多種方法進(jìn)行數(shù)據(jù)篩選
2.通過(guò)大作業(yè)砚嘴,學(xué)會(huì)了商品過(guò)濾、js異步加載的頁(yè)面分析涩拙,及簡(jiǎn)單的反爬技巧际长,對(duì)http協(xié)議有了更多的認(rèn)識(shí)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市兴泥,隨后出現(xiàn)的幾起案子工育,更是在濱河造成了極大的恐慌,老刑警劉巖搓彻,帶你破解...
    沈念sama閱讀 216,919評(píng)論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件如绸,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡旭贬,警方通過(guò)查閱死者的電腦和手機(jī)怔接,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,567評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)稀轨,“玉大人扼脐,你說(shuō)我怎么就攤上這事》芄簦” “怎么了瓦侮?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,316評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)佣谐。 經(jīng)常有香客問(wèn)我肚吏,道長(zhǎng),這世上最難降的妖魔是什么狭魂? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,294評(píng)論 1 292
  • 正文 為了忘掉前任罚攀,我火速辦了婚禮党觅,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘坞生。我一直安慰自己仔役,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,318評(píng)論 6 390
  • 文/花漫 我一把揭開(kāi)白布是己。 她就那樣靜靜地躺著又兵,像睡著了一般。 火紅的嫁衣襯著肌膚如雪卒废。 梳的紋絲不亂的頭發(fā)上沛厨,一...
    開(kāi)封第一講書(shū)人閱讀 51,245評(píng)論 1 299
  • 那天,我揣著相機(jī)與錄音摔认,去河邊找鬼逆皮。 笑死,一個(gè)胖子當(dāng)著我的面吹牛参袱,可吹牛的內(nèi)容都是我干的电谣。 我是一名探鬼主播,決...
    沈念sama閱讀 40,120評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼抹蚀,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼剿牺!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起环壤,我...
    開(kāi)封第一講書(shū)人閱讀 38,964評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤晒来,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后郑现,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體湃崩,經(jīng)...
    沈念sama閱讀 45,376評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,592評(píng)論 2 333
  • 正文 我和宋清朗相戀三年接箫,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了攒读。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,764評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡列牺,死狀恐怖整陌,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情瞎领,我是刑警寧澤泌辫,帶...
    沈念sama閱讀 35,460評(píng)論 5 344
  • 正文 年R本政府宣布,位于F島的核電站九默,受9級(jí)特大地震影響震放,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜驼修,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,070評(píng)論 3 327
  • 文/蒙蒙 一殿遂、第九天 我趴在偏房一處隱蔽的房頂上張望诈铛。 院中可真熱鬧,春花似錦墨礁、人聲如沸幢竹。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,697評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)焕毫。三九已至,卻和暖如春驶乾,著一層夾襖步出監(jiān)牢的瞬間邑飒,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,846評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工级乐, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留疙咸,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,819評(píng)論 2 370
  • 正文 我出身青樓风科,卻偏偏與公主長(zhǎng)得像撒轮,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子贼穆,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,665評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容