今天是1月28日,學(xué)習(xí)python差不多也搞了一周了誊酌,發(fā)現(xiàn)老是出錯部凑,由于不是學(xué)計算機的露乏,很多知識不能理解透徹,就讓學(xué)習(xí)起來加倍困難涂邀,不過看著自己學(xué)著敲出來的幾行代碼瘟仿,可以爬到初略的信息,還是信心滿滿比勉,昨天去拜訪老師劳较,他告訴我:“互聯(lián)網(wǎng)基本到頂,未來是大數(shù)據(jù)+AI”的浩聋,對極了观蜗!加油吧!
實現(xiàn)自己既定的目標(biāo)衣洁,必須能耐得住寂寞單干墓捻。
背景:今天在學(xué)爬小說列表的時候,發(fā)現(xiàn)一直報?IndexError: list index out of range 的錯誤坊夫,查了一下砖第,說對象里面的引用超出了范圍。注釋掉出錯的代碼环凿,試著把對象輸出厂画,得到空對象。
尋找了半天拷邢,發(fā)現(xiàn)class類定位的“ ”符號中袱院,多了個空格,無法找到...所以輸出空字典瞭稼。但是如果使用find函數(shù)忽洛,輸出的是None。從這里可以發(fā)現(xiàn)环肘,find_all函數(shù)輸出的是對象欲虚,而find函數(shù)輸出的是
1、find函數(shù)——一般查找符合你條件的第一條記錄并輸出
2悔雹、find_all函數(shù)——一般輸出所有符合條件的記錄复哆。
find和find_all函數(shù)一般是find_all('name',屬性),比如find_all('div',class_='xxxxx'),這樣來定位要抓取數(shù)據(jù)的位置腌零。
name一般是指div梯找,url,a標(biāo)簽這種益涧。