Python學(xué)習(xí)筆記(5):爬取一頁商品數(shù)據(jù)

我的代碼

from bs4 import BeautifulSoup
import requests
import time


#獲取產(chǎn)品鏈接
def get_links_from(who_sells):
    links = []
    urls = ['http://bj.58.com/pbdn/{}/pn{}/'.format(who_sells,i) for i in range(1,10)]
    for signal_url in urls:
        wb_data = requests.get(signal_url)
        time.sleep(5)     #避免訪問頻率過高,被網(wǎng)站反爬取
        if wb_data.status_code == 200:
            soup = BeautifulSoup(wb_data.text, 'lxml')
            for link in soup.select('td.t a.t'):
                links.append(link.get('href'))
    return links

def get_detail(who_sells=0):
    urls = get_links_from(who_sells)
    for url in urls:
        wd_data = requests.get(url)
        soup = BeautifulSoup(wd_data.text, 'lxml')
        
        #在瀏覽器的代碼檢查中靈活利用搜索定位元素位置,縮減代碼長度
        catalogs = soup.select('div > span > a')
        titles = soup.select('.info_titile')
        prices = soup.select('.price_now i')
        tags = soup.select('.biaoqian_li')
        ranges = soup.select('.palce_li span i')
        views = soup.select('.look_time')
        
        #因?yàn)楸纠衧elect返回列表中只有一個(gè)元素,可以直接在字典中賦值,如price[0]
        for catalog, title, price, tag, range,view in zip(catalogs, titles, prices, tags, ranges,views):
            data = {
                'catalog': catalog.get_text(),
                'title': title.get_text(),
                'price': price.get_text(),
                'tag': tag.get_text(),
                'range': range.get_text(),
                'view': view.get_text(),
            }
            print(data)

#根據(jù)傳入?yún)?shù)抓取不同數(shù)據(jù),0代表個(gè)人(默認(rèn)),1代表商家
get_detail()

總結(jié)

  • select方法返回的是一個(gè)列表
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子饭尝,更是在濱河造成了極大的恐慌七婴,老刑警劉巖宰缤,帶你破解...
    沈念sama閱讀 210,978評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件琐鲁,死亡現(xiàn)場離奇詭異菠齿,居然都是意外死亡志膀,警方通過查閱死者的電腦和手機(jī)熙宇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評論 2 384
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來溉浙,“玉大人烫止,你說我怎么就攤上這事〈粱” “怎么了馆蠕?”我有些...
    開封第一講書人閱讀 156,623評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長惊奇。 經(jīng)常有香客問我互躬,道長,這世上最難降的妖魔是什么颂郎? 我笑而不...
    開封第一講書人閱讀 56,324評論 1 282
  • 正文 為了忘掉前任吼渡,我火速辦了婚禮,結(jié)果婚禮上乓序,老公的妹妹穿的比我還像新娘寺酪。我一直安慰自己坎背,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,390評論 5 384
  • 文/花漫 我一把揭開白布寄雀。 她就那樣靜靜地躺著得滤,像睡著了一般。 火紅的嫁衣襯著肌膚如雪咙俩。 梳的紋絲不亂的頭發(fā)上耿戚,一...
    開封第一講書人閱讀 49,741評論 1 289
  • 那天湿故,我揣著相機(jī)與錄音阿趁,去河邊找鬼。 笑死坛猪,一個(gè)胖子當(dāng)著我的面吹牛脖阵,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播墅茉,決...
    沈念sama閱讀 38,892評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼命黔,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了就斤?” 一聲冷哼從身側(cè)響起悍募,我...
    開封第一講書人閱讀 37,655評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎洋机,沒想到半個(gè)月后坠宴,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,104評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡绷旗,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年喜鼓,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片衔肢。...
    茶點(diǎn)故事閱讀 38,569評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡庄岖,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出角骤,到底是詐尸還是另有隱情隅忿,我是刑警寧澤,帶...
    沈念sama閱讀 34,254評論 4 328
  • 正文 年R本政府宣布邦尊,位于F島的核電站背桐,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏胳赌。R本人自食惡果不足惜牢撼,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,834評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望疑苫。 院中可真熱鬧熏版,春花似錦纷责、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,725評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至曲横,卻和暖如春喂柒,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背禾嫉。 一陣腳步聲響...
    開封第一講書人閱讀 31,950評論 1 264
  • 我被黑心中介騙來泰國打工灾杰, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人熙参。 一個(gè)月前我還...
    沈念sama閱讀 46,260評論 2 360
  • 正文 我出身青樓艳吠,卻偏偏與公主長得像,于是被迫代替她去往敵國和親孽椰。 傳聞我的和親對象是個(gè)殘疾皇子昭娩,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,446評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 1. Java基礎(chǔ)部分 基礎(chǔ)部分的順序:基本語法,類相關(guān)的語法黍匾,內(nèi)部類的語法栏渺,繼承相關(guān)的語法,異常的語法锐涯,線程的語...
    子非魚_t_閱讀 31,597評論 18 399
  • 2017/3/14 RDBMS:關(guān)系型數(shù)據(jù)庫管理系統(tǒng) 關(guān)系模型獨(dú)立于語言 SQL有幾種不同類型的語言:數(shù)據(jù)定義語言...
    ancherl閱讀 1,603評論 0 6
  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 171,733評論 25 707
  • 這幾日小城的天氣是特別的磕诊,以往四季如春的小鎮(zhèn)冬季不飄雪,前一次下雪可是20年前全庸,當(dāng)時(shí)珍妮都還沒出生秀仲,用本地嬸嬸們的...
    蝦飛飛閱讀 332評論 0 1
  • 2016年5月4日,福建省信息進(jìn)村入戶試點(diǎn)工作培訓(xùn)班在農(nóng)業(yè)廳會議室舉辦壶笼。 會議由農(nóng)業(yè)廳市場信息處領(lǐng)導(dǎo)主持神僵,各設(shè)區(qū)市...
    義田農(nóng)場閱讀 381評論 0 0