入門級爬蟲（2）

requests庫入門實操我的個人博客

京東商品頁面爬取
亞馬遜商品頁面的爬取
百度/360搜索關(guān)鍵字提交
IP地址歸屬地查詢
網(wǎng)絡(luò)圖片的爬取和儲存

1.京東商品頁面的爬取

import requests
def GetHTMLText(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text[:1000]
    except:
        print("爬取失敗")
if __name__ == '__main__':
    url = "https://item.jd.com/30185690434.html"
    print(GetHTMLText(url))

image

2.亞馬孫商品頁面的爬取

某些網(wǎng)站可能有反爬機制纽乱。通常的反爬策略有:

通過Headers反爬蟲
基于用戶行為反爬蟲
動態(tài)頁面的反爬蟲
參考

#如網(wǎng)站對Headers的User-Agent進行檢測，可定制請求頭偽裝成瀏覽器
import requests
def GetHTMLText(url):
    try:
        #定制請求頭
        headers = {"user-agent":"Mozilla/5.0"}

        r = requests.get(url,headers = headers)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text[:1000]
    except:
        print("爬取失敗")
if __name__ == '__main__':
    url = "https://www.amazon.cn/gp/product/B01M8L5Z3Y"
    print(GetHTMLText(url))

3.百度/360搜索關(guān)鍵字提交

使用params參數(shù),利用接口keyword

#百度搜索引擎關(guān)鍵詞提交接口: http://www.baidu.com/s?wd=keyword
#360搜索引擎關(guān)鍵詞提交接口: http://www.so.com/s?q=keyword

import requests


def Get(url):
    headers = {'user-agent':'Mozilla/5.0'}
    key_word = {'wd':'python'}
    try:
        r=requests.get(url,headers=headers,params=key_word)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        print(r.request.url)
        #return r.request.url
        return r.text
    except:
        return "爬取失敗"

if __name__ == '__main__':
    url = "http://www.baidu.com/s"
    #print(Get(url))
    print(len(Get(url)))

image

4.IP地址歸屬地查詢

使用IP138的API接口
http://m.ip138.com/ip.asp?ip=ipaddress

# ip地址查詢
import requests

url ="http://m.ip138.com/ip.asp?ip="
ip = str(input())
try:
    r= requests.get(url+ip)
    r.raise_for_status()
    print(r.status_code)
    #r.encoding = r.apparent_encoding
    print(r.text[-500:])
except:
    print("failed")

image

5.網(wǎng)絡(luò)圖片的爬取和儲存

# spider_for_imgs

import requests
import os

url = "http://n.sinaimg.cn/sinacn12/w495h787/20180315/1923-fyscsmv9949374.jpg"
#C:\Users\Administrator\Desktop\spider\first week\imgs/
root = "C://Users/Administrator/Desktop/spider/first week/imgs/"

path = root + url.split('/')[-1]

try:
    if not os.path.exists(root):
        os.mkdir(root)
    if not os.path.exists(path):
        r = requests.get(url)
        with open(path, 'wb') as f:
            f.write(r.content)
            f.close()
            print("save successfully!")
    else:
        print("file already exist!")
except:
    print("spider fail")

image

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市最疆，隨后出現(xiàn)的幾起案子奠货，更是在濱河造成了極大的恐慌捷枯，老刑警劉巖旋膳，帶你破解...
沈念sama閱讀 221,576評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件菌瘫，死亡現(xiàn)場離奇詭異收夸，居然都是意外死亡坑匠，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,515評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門卧惜，熙熙樓的掌柜王于貴愁眉苦臉地迎上來笛辟，“玉大人，你說我怎么就攤上這事序苏∈执保” “怎么了？”我有些...
開封第一講書人閱讀 168,017評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵忱详，是天一觀的道長围来。經(jīng)常有香客問我，道長匈睁，這世上最難降的妖魔是什么监透？我笑而不...
開封第一講書人閱讀 59,626評論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮航唆，結(jié)果婚禮上胀蛮，老公的妹妹穿的比我還像新娘。我一直安慰自己糯钙，他們只是感情好粪狼，可當我...
茶點故事閱讀 68,625評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著任岸，像睡著了一般再榄。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上享潜，一...
開封第一講書人閱讀 52,255評論 1贊 308
城市分裂傳說
那天困鸥，我揣著相機與錄音，去河邊找鬼剑按。笑死疾就，一個胖子當著我的面吹牛澜术，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播猬腰，決...
沈念sama閱讀 40,825評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼瘪板，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了漆诽？” 一聲冷哼從身側(cè)響起侮攀，我...
開封第一講書人閱讀 39,729評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎厢拭，沒想到半個月后兰英，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,271評論 1贊 320
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡供鸠，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,363評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年畦贸，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片楞捂。...
茶點故事閱讀 40,498評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡薄坏，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出寨闹，到底是詐尸還是另有隱情胶坠，我是刑警寧澤，帶...
沈念sama閱讀 36,183評論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布繁堡，位于F島的核電站沈善，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏椭蹄。R本人自食惡果不足惜闻牡，卻給世界環(huán)境...
茶點故事閱讀 41,867評論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望绳矩。院中可真熱鬧罩润，春花似錦、人聲如沸翼馆。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,338評論 0贊 24
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽写妥。三九已至拳球，卻和暖如春审姓，著一層夾襖步出監(jiān)牢的瞬間珍特，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,458評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工魔吐，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留扎筒，地道東北人莱找。一個月前我還...
沈念sama閱讀 48,906評論 3贊 376
代替公主和親
正文我出身青樓，卻偏偏與公主長得像嗜桌，于是被迫代替她去往敵國和親奥溺。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 45,507評論 2贊 359

入門級爬蟲（2）

requests庫入門實操我的個人博客

1.京東商品頁面的爬取

2.亞馬孫商品頁面的爬取

3.百度/360搜索關(guān)鍵字提交

4.IP地址歸屬地查詢

5.網(wǎng)絡(luò)圖片的爬取和儲存

image

推薦閱讀更多精彩內(nèi)容