前面文章
python學習 二 02 爬一個圖片網(wǎng)站披蕉,獲得主鏈接網(wǎng)址颈畸,并保存
python學習 二 03 爬一個圖片網(wǎng)站-獲得所有分頁網(wǎng)址
本節(jié)目的:解析下載到本地的文件,獲得圖片鏈接
所有相關(guān)的網(wǎng)址没讲,都下載到本地了眯娱,下面我們依次解析,獲得圖片鏈接爬凑,然后將圖片鏈接保存起來徙缴。
由上圖,可看到
是一組贰谣,保存著背景圖片娜搂,那我們解析的時候,將這一組圖片吱抚,單獨的放在一個文件夾background中
是另一組百宇,解析的時候,單獨的放在一個文件夾中
第一步秘豹,我們遍歷目錄携御,獲得所有的文件路徑
為此,我寫了個函數(shù)
調(diào)用:
獲得目錄下的所有txt文件路徑,保存在txtFileList中啄刹。
第二步 解析文件涮坐,獲得IMG路徑
1、首先誓军,針對不同分組袱讹,創(chuàng)建相應(yīng)的子目錄
是一組,保存著背景圖片昵时,那我們解析的時候捷雕,將這一組圖片,單獨的放在一個文件夾background中
我們將右側(cè)的數(shù)字去掉壹甥,剩下的字符串作為這一組的類別
分析網(wǎng)頁源碼
圖像鏈接保存在class=subcontents的div下救巷,
為此我寫了個函數(shù)
調(diào)用
獲得文件中,所有圖片的鏈接列表
這一過程的詳細代碼如下: