python爬蟲筆記

1、requests.get/post(url,headers = headers, params = params/data=data)

#使用requests庫 根據(jù)網(wǎng)頁get或post請求(存在傳參的話get用params,post用data),得到一個Response對象

Response.text(打印文本)

Response.encoding(文本編碼)補充:decode()解碼:decode('gbk')把一個‘gbk’轉(zhuǎn)unicode編碼;encode()編碼:把unicode轉(zhuǎn)其他編碼

Response.content(以字節(jié)的方式訪問請求反應(yīng))

Response.status_code(響應(yīng)狀態(tài)碼)

2斋攀、xpath解析

from lxml import etree(導(dǎo)包)

html_page = etree.HTML(Response.content)

data = html_page.xpath('//select[@id="cx_province"]/option/@value')(xpath提取)

3自娩、bs4提取

from bs4 import BeautifulSoup(導(dǎo)包)

soup=BeautifulSoup(Response.content,‘lxml’)

links = soup.find_all('a',class_='')#查找所有clas=‘’的a標(biāo)簽

for? a in links:a.text(a標(biāo)簽下的文本)晤硕,a.get('href')(a標(biāo)簽的連接)

4挣柬、正則提取

惕虑。坟冲。。溃蔫。

5健提、json數(shù)據(jù)提取

json.loads()或者eval()

6、保存session對話訪問和代理ip訪問

def ip_sql():

#存入數(shù)據(jù)庫

db = MySQLdb.connect("192.168.201.91","root","123456","spidertools" )# 打開數(shù)據(jù)庫連接

cursor = db.cursor()# 使用cursor()方法獲取操作游標(biāo)

sql="SELECT * FROM proxyippool; "# 創(chuàng)建數(shù)據(jù)表SQL語句

cursor.execute(sql)

results = cursor.fetchall()# 獲取所有記錄列表

for row in results:

ip=row[0]+'://'+row[1]+':'+row[2]

ip_data.append(ip)

db.commit()

# 關(guān)閉數(shù)據(jù)庫連接

db.close()

# return ip_data



def savesql_hotel(data,savepoint_name):

import sqlite3

? ? #創(chuàng)建數(shù)據(jù)庫sqlite3

? ? con=sqlite3.connect(savepoint_name)

? ? con.execute('''CREATE TABLE IF NOT? EXISTS data

? ? ? ? (

? ? ? ? hoteltype varchar(200) NOT NULL,

? ? ? ? -- province varchar(200) NOT NULL,

? ? ? ? city varchar(200) NOT NULL,

? ? ? ? name varchar(1000) DEFAULT NULL,

? ? ? ? address varchar(1000) DEFAULT NULL,

? ? ? ? salesTel varchar(100) DEFAULT NULL,

? ? ? ? lat varchar(100) DEFAULT NULL,

? ? ? ? lng varchar(100) DEFAULT NULL,

? ? ? ? Url? varchar(1000) DEFAULT NULL);''')

? ? # 插入數(shù)據(jù)

? ? sql='insert into data(hoteltype,city,name,address,salesTel,lat,lng,Url)\

? ? values("%s","%s","%s","%s","%s","%s","%s","%s")'%(u'',data[0],data[1],data[2],data[3],data[4],data[5],data[6])

? ? con.execute(sql)

? ? con.commit()

? ? con.close()


se = requests.session()

ip= random.sample(ip_data,1)[0]從得到的代理ip池中隨機取出一個

se.proxies = {'http': ip,'https': ip}

jstext=se.get('http://www.sicy......',headers=headers).content

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末酒唉,一起剝皮案震驚了整個濱河市矩桂,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖侄榴,帶你破解...
    沈念sama閱讀 219,270評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件雹锣,死亡現(xiàn)場離奇詭異,居然都是意外死亡癞蚕,警方通過查閱死者的電腦和手機蕊爵,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來桦山,“玉大人攒射,你說我怎么就攤上這事『闼” “怎么了会放?”我有些...
    開封第一講書人閱讀 165,630評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長钉凌。 經(jīng)常有香客問我咧最,道長,這世上最難降的妖魔是什么御雕? 我笑而不...
    開封第一講書人閱讀 58,906評論 1 295
  • 正文 為了忘掉前任矢沿,我火速辦了婚禮,結(jié)果婚禮上酸纲,老公的妹妹穿的比我還像新娘捣鲸。我一直安慰自己,他們只是感情好闽坡,可當(dāng)我...
    茶點故事閱讀 67,928評論 6 392
  • 文/花漫 我一把揭開白布栽惶。 她就那樣靜靜地躺著,像睡著了一般疾嗅。 火紅的嫁衣襯著肌膚如雪媒役。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,718評論 1 305
  • 那天宪迟,我揣著相機與錄音,去河邊找鬼交惯。 笑死次泽,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的席爽。 我是一名探鬼主播意荤,決...
    沈念sama閱讀 40,442評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼只锻!你這毒婦竟也來了玖像?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,345評論 0 276
  • 序言:老撾萬榮一對情侶失蹤齐饮,失蹤者是張志新(化名)和其女友劉穎捐寥,沒想到半個月后笤昨,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,802評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡握恳,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,984評論 3 337
  • 正文 我和宋清朗相戀三年瞒窒,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片乡洼。...
    茶點故事閱讀 40,117評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡崇裁,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出束昵,到底是詐尸還是另有隱情拔稳,我是刑警寧澤,帶...
    沈念sama閱讀 35,810評論 5 346
  • 正文 年R本政府宣布锹雏,位于F島的核電站巴比,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏逼侦。R本人自食惡果不足惜匿辩,卻給世界環(huán)境...
    茶點故事閱讀 41,462評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望榛丢。 院中可真熱鬧铲球,春花似錦、人聲如沸晰赞。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽掖鱼。三九已至然走,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間戏挡,已是汗流浹背芍瑞。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留褐墅,地道東北人拆檬。 一個月前我還...
    沈念sama閱讀 48,377評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像妥凳,于是被迫代替她去往敵國和親竟贯。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,060評論 2 355

推薦閱讀更多精彩內(nèi)容