Python爬蟲之模擬淘寶搜索物品信息

寫在前面

環(huán)境：pycharm
用到的庫：re饱须、requests

過程

找到URL

在搜索框里輸入關(guān)鍵字芝薇，可以發(fā)現(xiàn)url發(fā)生了變化先巴，我們把一些不需要的參數(shù)給去掉椎工，試試網(wǎng)頁還能不能正常返回（別問我怎么知道哪些需要哪些不需要）

然后整理得到最終的URL是這個樣子的

分析網(wǎng)頁源代碼

這里我們查看網(wǎng)頁的源代碼，隨便搜索一個物品的名稱翘簇，發(fā)現(xiàn)是在raw_title這里面

同理撬码，我們可以找到價格的位置存放在raw_price里，這樣我們就可以獲取到名稱與價格了

實現(xiàn)過程

首先導(dǎo)入我們所需要的庫

import re
import requests

接下來是獲取網(wǎng)頁的源代碼

def getHTMLText(url):
    try:
        response = requests.get(url, timeout = 30)
        response.raise_for_status()
        response.encoding = 'utf-8'
        return response.text
    except:
        return ''

然后就是解析網(wǎng)頁版保，并獲取寶貝的價格和標(biāo)題了

def parseHtml(html):
    try:
        re_title = re.compile(r'"raw_title":"(.*?)"', re.S)
        re_price = re.compile(r'"view_price":"(.*?)"', re.S)
        raw_title = re.findall(re_title, html)
        view_price = re.findall(re_price, html)
        for title, price in zip(raw_title, view_price):
            print(title, price)
    except:
        return ''

基本大功告成了呜笑，再稍稍的添加一下功能夫否，比如分頁效果之類的(寫在main函數(shù)里了)

  def main():
    url = 'https://s.taobao.com/search?q='
    goods = input('查詢物品名稱：')
    deeps = int(input('查詢頁數(shù)：'))
    print('-' * 30)
    for i in range(deeps):
        html = getHTMLText(url + goods + "&s=" + str(44 *i))
        parseHtml(html)

nice，完整代碼貼上

import requests
import re

#獲取網(wǎng)頁源代碼
def getHTMLText(url):
    try:
        response = requests.get(url, timeout = 30)
        response.raise_for_status()
        response.encoding = 'utf-8'
        return response.text
    except:
        return ''

#解析網(wǎng)頁叫胁，并獲取寶貝的價格和標(biāo)題
def parseHtml(html):
    try:
        re_title = re.compile(r'"raw_title":"(.*?)"', re.S)
        re_price = re.compile(r'"view_price":"(.*?)"', re.S)
        raw_title = re.findall(re_title, html)
        view_price = re.findall(re_price, html)
        for title, price in zip(raw_title, view_price):
            print(title, price)
    except:
        return ''

def main():
    url = 'https://s.taobao.com/search?q='
    goods = input('查詢物品名稱：')
    deeps = int(input('查詢頁數(shù)：'))
    print('-' * 30)
    for i in range(deeps):
        html = getHTMLText(url + goods + "&s=" + str(44 *i))
        parseHtml(html)

if __name__ == '__main__':
    main()

完成

附一張效果圖

最后編輯于：2017.12.10 18:47:40

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末凰慈，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子驼鹅，更是在濱河造成了極大的恐慌微谓，老刑警劉巖，帶你破解...
沈念sama閱讀 212,080評論 6贊 493
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件输钩，死亡現(xiàn)場離奇詭異豺型，居然都是意外死亡，警方通過查閱死者的電腦和手機买乃，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,422評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門姻氨，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人剪验，你說我怎么就攤上這事肴焊。” “怎么了功戚？”我有些...
開封第一講書人閱讀 157,630評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵抖韩，是天一觀的道長。經(jīng)常有香客問我疫铜，道長茂浮，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 56,554評論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任壳咕，我火速辦了婚禮席揽，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘谓厘。我一直安慰自己幌羞，他們只是感情好，可當(dāng)我...
茶點故事閱讀 65,662評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布竟稳。她就那樣靜靜地躺著属桦，像睡著了一般。火紅的嫁衣襯著肌膚如雪他爸。梳的紋絲不亂的頭發(fā)上聂宾，一...
開封第一講書人閱讀 49,856評論 1贊 290
城市分裂傳說
那天，我揣著相機與錄音诊笤，去河邊找鬼系谐。笑死，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的纪他。我是一名探鬼主播鄙煤，決...
沈念sama閱讀 39,014評論 3贊 408
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼茶袒！你這毒婦竟也來了梯刚？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 37,752評論 0贊 268
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤薪寓，失蹤者是張志新（化名）和其女友劉穎亡资，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體预愤，經(jīng)...
沈念sama閱讀 44,212評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡沟于，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,541評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年咳胃，在試婚紗的時候發(fā)現(xiàn)自己被綠了植康。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 38,687評論 1贊 341
活死人
序言：一個原本活蹦亂跳的男人離奇死亡展懈，死狀恐怖销睁，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情存崖，我是刑警寧澤冻记，帶...
沈念sama閱讀 34,347評論 4贊 331
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站来惧，受9級特大地震影響冗栗，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜供搀，卻給世界環(huán)境...
茶點故事閱讀 39,973評論 3贊 315
男人毒藥：我在死后第九天來索命
文/蒙蒙一隅居、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧葛虐，春花似錦胎源、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,777評論 0贊 21
一樁弒父案涕蚤，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至的诵，卻和暖如春万栅，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背西疤。一陣腳步聲響...
開封第一講書人閱讀 32,006評論 1贊 266
情欲美人皮
我被黑心中介騙來泰國打工申钩，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人瘪阁。一個月前我還...
沈念sama閱讀 46,406評論 2贊 360
代替公主和親
正文我出身青樓撒遣，卻偏偏與公主長得像邮偎，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子义黎，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 43,576評論 2贊 349

Python爬蟲之模擬淘寶搜索物品信息

寫在前面

過程

找到URL

分析網(wǎng)頁源代碼

實現(xiàn)過程

完成

推薦閱讀更多精彩內(nèi)容