Python爬蟲之模擬淘寶搜索物品信息

寫在前面

環(huán)境:pycharm
用到的庫:re饱须、requests

過程

找到URL

在搜索框里輸入關(guān)鍵字芝薇,可以發(fā)現(xiàn)url發(fā)生了變化先巴,我們把一些不需要的參數(shù)給去掉椎工,試試網(wǎng)頁還能不能正常返回(別問我怎么知道哪些需要哪些不需要)



然后整理得到最終的URL是這個樣子的

分析網(wǎng)頁源代碼

這里我們查看網(wǎng)頁的源代碼,隨便搜索一個物品的名稱翘簇,發(fā)現(xiàn)是在raw_title這里面


同理撬码,我們可以找到價格的位置存放在raw_price里,這樣我們就可以獲取到名稱與價格了

實現(xiàn)過程

首先導(dǎo)入我們所需要的庫

import re
import requests

接下來是獲取網(wǎng)頁的源代碼

def getHTMLText(url):
    try:
        response = requests.get(url, timeout = 30)
        response.raise_for_status()
        response.encoding = 'utf-8'
        return response.text
    except:
        return ''

然后就是解析網(wǎng)頁版保,并獲取寶貝的價格和標(biāo)題了

def parseHtml(html):
    try:
        re_title = re.compile(r'"raw_title":"(.*?)"', re.S)
        re_price = re.compile(r'"view_price":"(.*?)"', re.S)
        raw_title = re.findall(re_title, html)
        view_price = re.findall(re_price, html)
        for title, price in zip(raw_title, view_price):
            print(title, price)
    except:
        return ''

基本大功告成了呜笑,再稍稍的添加一下功能夫否,比如分頁效果之類的(寫在main函數(shù)里了)

  def main():
    url = 'https://s.taobao.com/search?q='
    goods = input('查詢物品名稱:')
    deeps = int(input('查詢頁數(shù):'))
    print('-' * 30)
    for i in range(deeps):
        html = getHTMLText(url + goods + "&s=" + str(44 *i))
        parseHtml(html)

nice,完整代碼貼上

import requests
import re

#獲取網(wǎng)頁源代碼
def getHTMLText(url):
    try:
        response = requests.get(url, timeout = 30)
        response.raise_for_status()
        response.encoding = 'utf-8'
        return response.text
    except:
        return ''

#解析網(wǎng)頁叫胁,并獲取寶貝的價格和標(biāo)題
def parseHtml(html):
    try:
        re_title = re.compile(r'"raw_title":"(.*?)"', re.S)
        re_price = re.compile(r'"view_price":"(.*?)"', re.S)
        raw_title = re.findall(re_title, html)
        view_price = re.findall(re_price, html)
        for title, price in zip(raw_title, view_price):
            print(title, price)
    except:
        return ''

def main():
    url = 'https://s.taobao.com/search?q='
    goods = input('查詢物品名稱:')
    deeps = int(input('查詢頁數(shù):'))
    print('-' * 30)
    for i in range(deeps):
        html = getHTMLText(url + goods + "&s=" + str(44 *i))
        parseHtml(html)

if __name__ == '__main__':
    main()

完成

附一張效果圖

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末凰慈,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子驼鹅,更是在濱河造成了極大的恐慌微谓,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,080評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件输钩,死亡現(xiàn)場離奇詭異豺型,居然都是意外死亡,警方通過查閱死者的電腦和手機买乃,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,422評論 3 385
  • 文/潘曉璐 我一進店門姻氨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人剪验,你說我怎么就攤上這事肴焊。” “怎么了功戚?”我有些...
    開封第一講書人閱讀 157,630評論 0 348
  • 文/不壞的土叔 我叫張陵抖韩,是天一觀的道長。 經(jīng)常有香客問我疫铜,道長茂浮,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,554評論 1 284
  • 正文 為了忘掉前任壳咕,我火速辦了婚禮席揽,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘谓厘。我一直安慰自己幌羞,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,662評論 6 386
  • 文/花漫 我一把揭開白布竟稳。 她就那樣靜靜地躺著属桦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪他爸。 梳的紋絲不亂的頭發(fā)上聂宾,一...
    開封第一講書人閱讀 49,856評論 1 290
  • 那天,我揣著相機與錄音诊笤,去河邊找鬼系谐。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的纪他。 我是一名探鬼主播鄙煤,決...
    沈念sama閱讀 39,014評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼茶袒!你這毒婦竟也來了梯刚?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,752評論 0 268
  • 序言:老撾萬榮一對情侶失蹤薪寓,失蹤者是張志新(化名)和其女友劉穎亡资,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體预愤,經(jīng)...
    沈念sama閱讀 44,212評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡沟于,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,541評論 2 327
  • 正文 我和宋清朗相戀三年咳胃,在試婚紗的時候發(fā)現(xiàn)自己被綠了植康。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,687評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡展懈,死狀恐怖销睁,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情存崖,我是刑警寧澤冻记,帶...
    沈念sama閱讀 34,347評論 4 331
  • 正文 年R本政府宣布,位于F島的核電站来惧,受9級特大地震影響冗栗,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜供搀,卻給世界環(huán)境...
    茶點故事閱讀 39,973評論 3 315
  • 文/蒙蒙 一隅居、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧葛虐,春花似錦胎源、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,777評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至的诵,卻和暖如春万栅,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背西疤。 一陣腳步聲響...
    開封第一講書人閱讀 32,006評論 1 266
  • 我被黑心中介騙來泰國打工申钩, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人瘪阁。 一個月前我還...
    沈念sama閱讀 46,406評論 2 360
  • 正文 我出身青樓撒遣,卻偏偏與公主長得像邮偎,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子义黎,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,576評論 2 349

推薦閱讀更多精彩內(nèi)容