Python: 實驗爬取虎撲籃球圖片

編程確實是一個鍛煉邏輯思維最有效的工具之一唾琼,之前自學Python走触。總是陷入一個怪圈:看入門數(shù)據(jù)--一段時間不用忘記了--繼續(xù)看入門書籍叭首。書是看了很多习勤,編程技術卻沒有提高。

后來看了一本書焙格,里面有些觀點讓我茅塞頓開图毕。

做任何事情一定有在短期內簡單可行的辦法。學習不應該是苦差事眷唉,而應該是快樂的予颤,重要的是找到適合自己的學習方法

在漢語中冬阳,掌握常見的1500-2000個字就能看懂80%的文字蛤虐。在編程中,同樣有著最核心的關鍵知識肝陪。先用這些關鍵的知識構建你的知識體系會讓你學習效率加速驳庭,這是比一開始就鉆到各種細枝末節(jié)里面更好的學習方式。

學習編程是為了真正做出點東西來氯窍。先掌握項目所需的最少必要知識饲常,然后把熱情和精力投入到搭建真實項目中捏检,而不是死磕半年的基礎知識,直到把所有興趣都耗竭了也沒做出什么像樣的東西不皆。

初學者經(jīng)常會遇到的困惑是贯城,看書上或是聽課都懂,但還是不明白要怎么編程霹娄。這是因為缺乏足夠多的實踐能犯。

思維方式改變之后,就是付諸行動了犬耻。最近一直在找練手的小項目來磨煉編程技術踩晶。首先最讓我感興趣的就是Python爬蟲。所以最近一直去爬各種網(wǎng)站的圖片枕磁。

本文要講的是如何爬取虎撲籃球圖片渡蜻。

為簡單起見,先從單個網(wǎng)頁的一個圖片說起计济。后期將進行封裝茸苇,以提高可用性。

創(chuàng)建文件保存目錄

# Create folder for store picture
sub_folder = os.path.join(os.getcwd(), "hupupic")
if not os.path.exists(sub_folder):
    os.mkdir(sub_folder)
# os.chdir(sub_folder)

設置Proxy

# Set proxy
proxy_support = urllib2.ProxyHandler({"http":"http://your_proxy:8080/"})
opener = urllib2.build_opener(proxy_support)
urllib2.install_opener(opener)

解析目標網(wǎng)頁沦寂,得到圖片真實地址

sample_url = 'http://photo.hupu.com/nba/p29556-1.html'
req = urllib2.Request(url=sample_url)
resp = urllib2.urlopen(req)
html = resp.read()

start = html.find(r'<div class="flTab">')
end = html.find(r'<div class="comMark" style>')
content = html[start:end]
div_pat = r'<div.*?>(.*?)<\/div>'
div_m = re.findall(div_pat, content, re.S|re.M)
# print div_m[2]
link_list = re.findall(r"(?<=href=\").+?(?=\")|(?<=href=\').+?(?=\')", div_m[2])
pic_url = link_list[0]

保存到電腦

file_path = sub_folder
file_name = pic_url.split("/")[-1]
print file_name
fname = file_path + "\\" + file_name
f = urllib2.urlopen(pic_url)
with open(fname, 'wb') as img_file:
    img_file.write(f.read())
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末学密,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子传藏,更是在濱河造成了極大的恐慌腻暮,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,599評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件毯侦,死亡現(xiàn)場離奇詭異哭靖,居然都是意外死亡,警方通過查閱死者的電腦和手機侈离,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,629評論 3 385
  • 文/潘曉璐 我一進店門试幽,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人霍狰,你說我怎么就攤上這事抡草。” “怎么了蔗坯?”我有些...
    開封第一講書人閱讀 158,084評論 0 348
  • 文/不壞的土叔 我叫張陵康震,是天一觀的道長。 經(jīng)常有香客問我宾濒,道長腿短,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,708評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮橘忱,結果婚禮上赴魁,老公的妹妹穿的比我還像新娘。我一直安慰自己钝诚,他們只是感情好毛雇,可當我...
    茶點故事閱讀 65,813評論 6 386
  • 文/花漫 我一把揭開白布固歪。 她就那樣靜靜地躺著闸溃,像睡著了一般揩瞪。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上拧略,一...
    開封第一講書人閱讀 50,021評論 1 291
  • 那天芦岂,我揣著相機與錄音,去河邊找鬼垫蛆。 笑死禽最,一個胖子當著我的面吹牛,可吹牛的內容都是我干的袱饭。 我是一名探鬼主播川无,決...
    沈念sama閱讀 39,120評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼宁赤!你這毒婦竟也來了舀透?” 一聲冷哼從身側響起栓票,我...
    開封第一講書人閱讀 37,866評論 0 268
  • 序言:老撾萬榮一對情侶失蹤决左,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后走贪,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體佛猛,經(jīng)...
    沈念sama閱讀 44,308評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,633評論 2 327
  • 正文 我和宋清朗相戀三年坠狡,在試婚紗的時候發(fā)現(xiàn)自己被綠了继找。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,768評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡逃沿,死狀恐怖婴渡,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情凯亮,我是刑警寧澤边臼,帶...
    沈念sama閱讀 34,461評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站假消,受9級特大地震影響柠并,放射性物質發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,094評論 3 317
  • 文/蒙蒙 一臼予、第九天 我趴在偏房一處隱蔽的房頂上張望鸣戴。 院中可真熱鬧,春花似錦粘拾、人聲如沸窄锅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,850評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽酬滤。三九已至,卻和暖如春寓涨,著一層夾襖步出監(jiān)牢的瞬間盯串,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,082評論 1 267
  • 我被黑心中介騙來泰國打工戒良, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留体捏,地道東北人。 一個月前我還...
    沈念sama閱讀 46,571評論 2 362
  • 正文 我出身青樓糯崎,卻偏偏與公主長得像几缭,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子沃呢,可洞房花燭夜當晚...
    茶點故事閱讀 43,666評論 2 350

推薦閱讀更多精彩內容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 171,855評論 25 707
  • 昨天剛看完三生三世十里桃花年栓, 很滿意, 真希望是電視劇薄霜, 那樣就可以看兩人同框看很久某抓。 只要劉亦菲和楊洋作為白夜夫...
    善木閱讀 691評論 0 2
  • 今天帶Tom去看了鼓曲表演,時間比較緊湊惰瓜,放學回家看了16本海和牛否副,在天橋劇院等待入場時玩了Johnny Hamm...
    紫夜1606閱讀 130評論 0 0
  • 醫(yī)生女兒的心愿 池上碧苔 星期天,兒科主治醫(yī)生病醫(yī)生剛上小學二年級的女兒貝貝跟隨爸爸來到了門診室崎坊。 爸爸接待的第一...
    池上碧苔閱讀 198評論 0 0
  • 我在相遇的那一刻备禀,就做好目送你離去的準備。 但即便如此奈揍,你離去的那一刻曲尸,我依然比想象中的更黯然傷魂。也比想象中的失...
    君曉墨閱讀 225評論 0 0