parse模塊

url.parse :定義了url的標(biāo)準(zhǔn)接口游添，實現(xiàn)url的各種抽取parse模塊的使用：url的解析通熄，合并，編碼唇辨，解碼

使用時需導(dǎo)入

from urllib import parse

urlparse()實現(xiàn)URL的識別和分段

url = 'https://book.qidian.com/info/1004608738?wd=123&page=20#Catalog'
"""
url：待解析的url
scheme=''：假如解析的url沒有協(xié)議,可以設(shè)置默認(rèn)的協(xié)議,如果url有協(xié)議，設(shè)置此參數(shù)無效
allow_fragments=True：是否忽略錨點,默認(rèn)為True表示不忽略,為False表示忽略
"""
result = parse.urlparse(url=url,scheme='http',allow_fragments=True)

print(result)
print(result.scheme)
"""
(scheme='https', netloc='book.qidian.com', path='/info/1004608738', params='', query='wd=123&page=20', fragment='Catalog')
scheme:表示協(xié)議
netloc:域名
path:路徑
params:參數(shù)
query:查詢條件，一般都是get請求的url
fragment:錨點嗡贺，用于直接定位頁
面的下拉位置鞍帝，跳轉(zhuǎn)到網(wǎng)頁的指定位置
"""

urlunparse()可以實現(xiàn)URL的構(gòu)造

url_parmas = ('https', 'book.qidian.com', '/info/1004608738', '', 'wd=123&page=20', 'Catalog')
components:是一個可迭代對象，長度必須為6
result = parse.urlunparse(url_parmas)
print(result)
"""
https://book.qidian.com/info/1004608738wd=123&page=20#Catalog
"""

urljoin()傳遞一個基礎(chǔ)鏈接,根據(jù)基礎(chǔ)鏈接可以將某一個不完整的鏈接拼接為一個完整鏈接

base_url = 'https://book.qidian.com/info/1004608738?wd=123&page=20#Catalog'
sub_url = '/info/100861102'

full_url = parse.urljoin(base_url,sub_url)

print(full_url)

urlencode()將字典構(gòu)形式的參數(shù)序列化為url編碼后的字符串（常用來構(gòu)造get請求和post請求的參數(shù)）k1=v1&k2=v2

parmas = {
'wd':'123',
'page':20
}
parmas_str = parse.urlencode(parmas)

print(parmas_str)

"""
page=20&wd=123
"""

parse_qs()將url編碼格式的參數(shù)反序列化為字典類型

parmas_str = 'page=20&wd=123'
parmas = parse.parse_qs(parmas_str)
print(parmas)

"""
{'page': ['20'], 'wd': ['123']}
"""

quote()可以將中文轉(zhuǎn)換為URL編碼格式

word = '中國夢'
url = 'http://www.baidu.com/s?wd='+parse.quote(word)
print(parse.quote(word))
print(url)

"""
%E4%B8%AD%E5%9B%BD%E6%A2%A6
http://www.baidu.com/s?wd=%E4%B8%AD%E5%9B%BD%E6%A2%A6
"""

unquote:可以將URL編碼進(jìn)行解碼

url = 'http://www.baidu.com/s?wd=%E4%B8%AD%E5%9B%BD%E6%A2%A6'
print(parse.unquote(url))
"""
http://www.baidu.com/s?wd=中國夢
"""

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末摄凡，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子钦扭，更是在濱河造成了極大的恐慌床绪，老刑警劉巖，帶你破解...
沈念sama閱讀 217,826評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件膀斋，死亡現(xiàn)場離奇詭異痹雅，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)绩社，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,968評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來项鬼，“玉大人劲阎，你說我怎么就攤上這事∶跸桑” “怎么了？”我有些...
開封第一講書人閱讀 164,234評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵沦零，是天一觀的道長货岭。經(jīng)常有香客問我，道長千贯，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,562評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任魁袜，我火速辦了婚禮，結(jié)果婚禮上店量，老公的妹妹穿的比我還像新娘。我一直安慰自己融师，他們只是感情好粟按，可當(dāng)我...
茶點故事閱讀 67,611評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著疼鸟，像睡著了一般庙曙。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上捌朴，一...
開封第一講書人閱讀 51,482評論 1贊 302
城市分裂傳說
那天，我揣著相機(jī)與錄音洼怔，去河邊找鬼左驾。笑死，一個胖子當(dāng)著我的面吹牛诡右，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播帆吻，決...
沈念sama閱讀 40,271評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼猜煮，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了王带？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,166評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎被丧，沒想到半個月后盟戏，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,608評論 1贊 314
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡邮旷，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,814評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年蝇摸，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片律歼。...
茶點故事閱讀 39,926評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡啡专，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出们童，到底是詐尸還是另有隱情，我是刑警寧澤跷跪，帶...
沈念sama閱讀 35,644評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布齐板，位于F島的核電站，受9級特大地震影響覆积，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜尉姨，卻給世界環(huán)境...
茶點故事閱讀 41,249評論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一吗冤、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧椎瘟，春花似錦、人聲如沸肺蔚。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,866評論 0贊 22
一樁弒父案璧诵，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至之宿，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間色难，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,991評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工枷莉，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留项滑，地道東北人。一個月前我還...
沈念sama閱讀 48,063評論 3贊 370
代替公主和親
正文我出身青樓危喉，卻偏偏與公主長得像州疾，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子严蓖，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,871評論 2贊 354

parse模塊

使用時需導(dǎo)入

urlparse()實現(xiàn)URL的識別和分段

urlunparse()可以實現(xiàn)URL的構(gòu)造

urljoin()傳遞一個基礎(chǔ)鏈接,根據(jù)基礎(chǔ)鏈接可以將某一個不完整的鏈接拼接為一個完整鏈接

urlencode()將字典構(gòu)形式的參數(shù)序列化為url編碼后的字符串（常用來構(gòu)造get請求和post請求的參數(shù)）k1=v1&k2=v2

parse_qs()將url編碼格式的參數(shù)反序列化為字典類型

quote()可以將中文轉(zhuǎn)換為URL編碼格式

unquote:可以將URL編碼進(jìn)行解碼

推薦閱讀更多精彩內(nèi)容