urllib.parse模塊定義的函數(shù)有兩大類別分別為《解析類別》和《轉(zhuǎn)碼類別》
《解析類別有》
1.urllib.parse.urlparse 《分割urlparse里指定的URL,將其分割為scheme,netloc,params,query,fragment,可設(shè)置fragment參數(shù)指定是否顯示fragment》
例:
result = urllib.parse.urlparse("http://www.reibang.com/writer#/notebooks/52963477/notes/104310197/preview")
result2 = urllib.parse.urlparse("http://www.reibang.com/writer#/notebooks/52963477/notes/104310197/preview",allow_fragments=False)
print(result,result2)
result輸出
scheme='https', netloc='www.reibang.com', path='/writer', params='', query='', fragment='/notebooks/52963477/notes/104310197/preview'
result2輸出
scheme='https', netloc='www.reibang.com', path='/writer#/notebooks/52963477/notes/104310197/preview', params='', query='', fragment=''
2.urllib.parse.urlunparse 《與urlparse相反楼雹,此函數(shù)為構(gòu)造URL史煎,接受一個(gè)可迭代對(duì)象,且該對(duì)象長(zhǎng)度必須為6》
例:
url = ['https','www.reibang.com','writer','','','/notebooks/52963477/notes/104310197/preview']
result = urllib.parse.urlunparse(url)
print(result)
3.urllib.parse.urlsplit 《與urlparse類似,但params對(duì)象和path對(duì)象一同顯示》
4.urllib.parse.urlunsplit 《與urlunparse類似,但接受的可迭代對(duì)象長(zhǎng)度必須為5,缺少了parmas對(duì)象》
5.urllib.parse.urljoin 《合并基準(zhǔn)URL和參數(shù)URL》
例:
print(urllib.parse.urljoin("https://www.baidu.com","s?wd=%E7%96%91%E6%90%AD%E8%BD%BD%E4%BD%A9%E6%B4%9B%E8%A5%BF%E9%A3%9E%E6%9C%BA%E6%B6%88%E5%A4%B1%E5%9C%A8%E5%A4%A7%E4%BC%97%E8%A7%86%E7%BA%BF&sa=fyb_n_homepage&rsv_dl=fyb_n_homepage&from=super&cl=3&tn=baidutop10&fr=top1000&rsv_idx=2&hisfilter=1"))
print(urllib.parse.urljoin("https://www.baidu.com/s?wd=%E7%96%91%E6%90%AD%E8%BD%BD%E4%BD%A9%E6%B4%9B%E8%A5%BF%E9%A3%9E%E6%9C%BA%E6%B6%88%E5%A4%B1%E5%9C%A8%E5%A4%A7%E4%BC%97%E8%A7%86%E7%BA%BF&sa=fyb_n_homepage&rsv_dl=fyb_n_homepage&from=super&cl=3&tn=baidutop10&fr=top1000&rsv_idx=2&hisfilter=1","https://baike.baidu.com/item/%E5%8D%97%E5%B8%8C%C2%B7%E4%BD%A9%E6%B4%9B%E8%A5%BF/11038248"))
print(urllib.parse.urljoin("https://www.baidu.com/s?wd=%E7%96%91%E6%90%AD%E8%BD%BD%E4%BD%A9%E6%B4%9B%E8%A5%BF%E9%A3%9E%E6%9C%BA%E6%B6%88%E5%A4%B1%E5%9C%A8%E5%A4%A7%E4%BC%97%E8%A7%86%E7%BA%BF&sa=fyb_n_homepage&rsv_dl=fyb_n_homepage&from=super&cl=3&tn=baidutop10&fr=top1000&rsv_idx=2&hisfilter=1","/s?wd=佩洛西訪亞洲行程公布%20未提臺(tái)灣&usm=1&ie=utf-8&rsv_pq=c70cbd19000aa88c"))
print(urllib.parse.urljoin("https://baike.baidu.com/item/%E5%8D%97%E5%B8%8C%C2%B7%E4%BD%A9%E6%B4%9B%E8%A5%BF/11038248","/item/%E5%91%A8%E6%9D%B0%E4%BC%A6/129156?fr=aladdin"))
第一個(gè)輸出https://www.baidu.com/s?wd=%E7%96%91%E6%90%AD%E8%BD%BD%E4%BD%A9%E6%B4%9B%E8%A5%BF%E9%A3%9E%E6%9C%BA%E6%B6%88%E5%A4%B1%E5%9C%A8%E5%A4%A7%E4%BC%97%E8%A7%86%E7%BA%BF&sa=fyb_n_homepage&rsv_dl=fyb_n_homepage&from=super&cl=3&tn=baidutop10&fr=top1000&rsv_idx=2&hisfilter=1
第二個(gè)輸出https://baike.baidu.com/item/%E5%8D%97%E5%B8%8C%C2%B7%E4%BD%A9%E6%B4%9B%E8%A5%BF/11038248
第三個(gè)輸出https://www.baidu.com/s?wd=佩洛西訪亞洲行程公布%20未提臺(tái)灣&usm=1&ie=utf-8&rsv_pq=c70cbd19000aa88c
第四個(gè)輸出https://baike.baidu.com/item/%E5%91%A8%E6%9D%B0%E4%BC%A6/129156?fr=aladdin
6.urllib.parse.parse_qs 《解析字符串參數(shù)返回字典形式數(shù)據(jù)》
例:
segmentation = urllib.parse.urlparse("https://www.baidu.com/s?wd=%E9%98%BF%E5%A7%A81%E4%B8%AA%E6%9C%88%E4%BA%A4%E5%BE%8020%E5%A4%9A%E5%90%8D%E7%94%B7%E5%AD%90%E8%AE%A9%E4%B9%B0%E6%B0%B4%E6%9E%9C")
query = segmentation.query
strQuery = urllib.parse.parse_qs(query)
print(strQuery)
輸出{'wd': ['阿姨1個(gè)月交往20多名男子讓買(mǎi)水果']}
7.urllib.parse.parse_qsl 《解析字符串參數(shù)返回字段名和字段值對(duì)列表形式數(shù)據(jù)》
例:
segmentation = urllib.parse.urlparse("https://www.baidu.com/s?wd=%E9%98%BF%E5%A7%A81%E4%B8%AA%E6%9C%88%E4%BA%A4%E5%BE%8020%E5%A4%9A%E5%90%8D%E7%94%B7%E5%AD%90%E8%AE%A9%E4%B9%B0%E6%B0%B4%E6%9E%9C")
query = segmentation.query
strQuery = urllib.parse.parse_qsl(query)
print(strQuery)
輸出[('wd', '阿姨1個(gè)月交往20多名男子讓買(mǎi)水果')]
《轉(zhuǎn)碼類別有》
1.urllib.parse.urlencode 《轉(zhuǎn)為ASCII 文本字符串》
例:
params = {"ie":"UTF-8","wd":"字節(jié)串"}
baseUrl = "https://www.baidu.com/s?"
finalUrl = urllib.parse.urljoin(baseUrl,urllib.parse.urlencode(params))
finalUrl2 = baseUrl+urllib.parse.urlencode(params)
print(finalUrl)
print(finalUrl2)
第一個(gè)輸出https://www.baidu.com/ie=UTF-8&wd=%E5%AD%97%E8%8A%82%E4%B8%B2
第二個(gè)輸出https://www.baidu.com/s?ie=UTF-8&wd=%E5%AD%97%E8%8A%82%E4%B8%B2
2.urllib.parse.quote 《將文本字符串轉(zhuǎn)換為字節(jié)碼》
3.urllib.parse.unquote 《與urllib.parse.quote正相反》
例:
url = "https://www.baidu.com/s?wd=%E9%B8%BF%E6%98%9F%E5%B0%94%E5%85%8B%E5%86%8D%E6%8D%901%E4%B8%AA%E4%BA%BF&sa=fyb_n_homepage&rsv_dl=fyb_n_homepage&from=super&cl=3&tn=baidutop10&fr=top1000&rsv_idx=2&hisfilter=1"
segmentation = urllib.parse.urlparse(url)
segmentationStr = segmentation.query.split("&")[0].split("=")[1]
finalStr = urllib.parse.unquote(segmentationStr)
print(finalStr)
finalStr2 = urllib.parse.quote(finalStr)
print(finalStr2)
第一個(gè)輸出:鴻星爾克再捐1個(gè)億
第二個(gè)輸出:%E9%B8%BF%E6%98%9F%E5%B0%94%E5%85%8B%E5%86%8D%E6%8D%901%E4%B8%AA%E4%BA%BF
Python urllib-parse模塊
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
- 文/潘曉璐 我一進(jìn)店門(mén)砰粹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人造挽,你說(shuō)我怎么就攤上這事碱璃。” “怎么了饭入?”我有些...
- 文/不壞的土叔 我叫張陵嵌器,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我谐丢,道長(zhǎng)爽航,這世上最難降的妖魔是什么蚓让? 我笑而不...
- 正文 為了忘掉前任,我火速辦了婚禮讥珍,結(jié)果婚禮上历极,老公的妹妹穿的比我還像新娘。我一直安慰自己串述,他們只是感情好执解,可當(dāng)我...
- 文/花漫 我一把揭開(kāi)白布寞肖。 她就那樣靜靜地躺著纲酗,像睡著了一般。 火紅的嫁衣襯著肌膚如雪新蟆。 梳的紋絲不亂的頭發(fā)上觅赊,一...
- 那天,我揣著相機(jī)與錄音琼稻,去河邊找鬼吮螺。 笑死,一個(gè)胖子當(dāng)著我的面吹牛帕翻,可吹牛的內(nèi)容都是我干的鸠补。 我是一名探鬼主播,決...
- 文/蒼蘭香墨 我猛地睜開(kāi)眼嘀掸,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼紫岩!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起睬塌,我...
- 序言:老撾萬(wàn)榮一對(duì)情侶失蹤泉蝌,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后揩晴,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體勋陪,經(jīng)...
- 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
- 正文 我和宋清朗相戀三年硫兰,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了诅愚。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片劫映。...
- 正文 年R本政府宣布摹蘑,位于F島的核電站筹燕,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜撒踪,卻給世界環(huán)境...
- 文/蒙蒙 一过咬、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧制妄,春花似錦掸绞、人聲如沸。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至俺抽,卻和暖如春敞映,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背磷斧。 一陣腳步聲響...
- 正文 我出身青樓冕末,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親侣颂。 傳聞我的和親對(duì)象是個(gè)殘疾皇子档桃,可洞房花燭夜當(dāng)晚...
推薦閱讀更多精彩內(nèi)容
- urlparse:定義了url的標(biāo)準(zhǔn)接口,實(shí)現(xiàn)url的各種抽取 urlunparse:與上面的方法相反横蜒,是構(gòu)造一個(gè)...
- python3.6版本的urlparse模塊需要先引包胳蛮,這個(gè)地方區(qū)別于python2.7 我發(fā)現(xiàn)需要獲取的圖片的鏈...
- url.parse :定義了url的標(biāo)準(zhǔn)接口,實(shí)現(xiàn)url的各種抽取 urlunparse:與上面的方法相反丛晌,是構(gòu)造...