Python: 實驗爬取虎撲籃球圖片

編程確實是一個鍛煉邏輯思維最有效的工具之一唾琼，之前自學Python走触。總是陷入一個怪圈：看入門數(shù)據(jù)--一段時間不用忘記了--繼續(xù)看入門書籍叭首。書是看了很多习勤，編程技術卻沒有提高。

后來看了一本書焙格，里面有些觀點讓我茅塞頓開图毕。

做任何事情一定有在短期內簡單可行的辦法。學習不應該是苦差事眷唉，而應該是快樂的予颤，重要的是找到適合自己的學習方法。

在漢語中冬阳，掌握常見的1500-2000個字就能看懂80%的文字蛤虐。在編程中，同樣有著最核心的關鍵知識肝陪。先用這些關鍵的知識構建你的知識體系會讓你學習效率加速驳庭，這是比一開始就鉆到各種細枝末節(jié)里面更好的學習方式。

學習編程是為了真正做出點東西來氯窍。先掌握項目所需的最少必要知識饲常，然后把熱情和精力投入到搭建真實項目中捏检，而不是死磕半年的基礎知識，直到把所有興趣都耗竭了也沒做出什么像樣的東西不皆。

初學者經(jīng)常會遇到的困惑是贯城，看書上或是聽課都懂，但還是不明白要怎么編程霹娄。這是因為缺乏足夠多的實踐能犯。

思維方式改變之后，就是付諸行動了犬耻。最近一直在找練手的小項目來磨煉編程技術踩晶。首先最讓我感興趣的就是Python爬蟲。所以最近一直去爬各種網(wǎng)站的圖片枕磁。

本文要講的是如何爬取虎撲籃球圖片渡蜻。

為簡單起見，先從單個網(wǎng)頁的一個圖片說起计济。后期將進行封裝茸苇，以提高可用性。

創(chuàng)建文件保存目錄

# Create folder for store picture
sub_folder = os.path.join(os.getcwd(), "hupupic")
if not os.path.exists(sub_folder):
    os.mkdir(sub_folder)
# os.chdir(sub_folder)

設置Proxy

# Set proxy
proxy_support = urllib2.ProxyHandler({"http":"http://your_proxy:8080/"})
opener = urllib2.build_opener(proxy_support)
urllib2.install_opener(opener)

解析目標網(wǎng)頁沦寂，得到圖片真實地址

sample_url = 'http://photo.hupu.com/nba/p29556-1.html'
req = urllib2.Request(url=sample_url)
resp = urllib2.urlopen(req)
html = resp.read()

start = html.find(r'<div class="flTab">')
end = html.find(r'<div class="comMark" style>')
content = html[start:end]
div_pat = r'<div.*?>(.*?)<\/div>'
div_m = re.findall(div_pat, content, re.S|re.M)
# print div_m[2]
link_list = re.findall(r"(?<=href=\").+?(?=\")|(?<=href=\').+?(?=\')", div_m[2])
pic_url = link_list[0]

保存到電腦

file_path = sub_folder
file_name = pic_url.split("/")[-1]
print file_name
fname = file_path + "\\" + file_name
f = urllib2.urlopen(pic_url)
with open(fname, 'wb') as img_file:
    img_file.write(f.read())

最后編輯于：2017.12.04 00:35:25

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末学密，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子传藏，更是在濱河造成了極大的恐慌腻暮，老刑警劉巖，帶你破解...
沈念sama閱讀 212,599評論 6贊 492
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件毯侦，死亡現(xiàn)場離奇詭異哭靖，居然都是意外死亡，警方通過查閱死者的電腦和手機侈离，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,629評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門试幽，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人霍狰，你說我怎么就攤上這事抡草。” “怎么了蔗坯？”我有些...
開封第一講書人閱讀 158,084評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵康震，是天一觀的道長。經(jīng)常有香客問我宾濒，道長腿短，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 56,708評論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮橘忱，結果婚禮上赴魁，老公的妹妹穿的比我還像新娘。我一直安慰自己钝诚，他們只是感情好毛雇，可當我...
茶點故事閱讀 65,813評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布固歪。她就那樣靜靜地躺著闸溃，像睡著了一般揩瞪。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上拧略，一...
開封第一講書人閱讀 50,021評論 1贊 291
城市分裂傳說
那天芦岂，我揣著相機與錄音，去河邊找鬼垫蛆。笑死禽最，一個胖子當著我的面吹牛，可吹牛的內容都是我干的袱饭。我是一名探鬼主播川无，決...
沈念sama閱讀 39,120評論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼宁赤！你這毒婦竟也來了舀透？” 一聲冷哼從身側響起栓票，我...
開封第一講書人閱讀 37,866評論 0贊 268
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤决左，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后走贪，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體佛猛，經(jīng)...
沈念sama閱讀 44,308評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 36,633評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年坠狡，在試婚紗的時候發(fā)現(xiàn)自己被綠了继找。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 38,768評論 1贊 341
活死人
序言：一個原本活蹦亂跳的男人離奇死亡逃沿，死狀恐怖婴渡，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情凯亮，我是刑警寧澤边臼，帶...
沈念sama閱讀 34,461評論 4贊 333
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站假消，受9級特大地震影響柠并，放射性物質發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 40,094評論 3贊 317
男人毒藥：我在死后第九天來索命
文/蒙蒙一臼予、第九天我趴在偏房一處隱蔽的房頂上張望鸣戴。院中可真熱鬧，春花似錦粘拾、人聲如沸窄锅。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,850評論 0贊 21
一樁弒父案缰雇，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽酬滤。三九已至，卻和暖如春寓涨，著一層夾襖步出監(jiān)牢的瞬間盯串，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,082評論 1贊 267
情欲美人皮
我被黑心中介騙來泰國打工戒良，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留体捏，地道東北人。一個月前我還...
沈念sama閱讀 46,571評論 2贊 362
代替公主和親
正文我出身青樓糯崎，卻偏偏與公主長得像几缭，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子沃呢，可洞房花燭夜當晚...
茶點故事閱讀 43,666評論 2贊 350

Python: 實驗爬取虎撲籃球圖片

創(chuàng)建文件保存目錄

設置Proxy

解析目標網(wǎng)頁沦寂，得到圖片真實地址

保存到電腦

推薦閱讀更多精彩內容