原文地址:https://blog.csdn.net/zly412934578/article/details/77776659
This module defines a standard interface to break Uniform Resource Locator (URL) strings up in components (addressing scheme, network location, path etc.), to combine the components back into a URL string, and to convert a “relative URL” to an absolute URL given a “base URL.”
以上是官方API上對這個模塊的解釋:這個模塊是一個能URL字符串拆分成組件笨腥,能把組件合并成URL和將一個相對的URL轉(zhuǎn)成一個抽象的URL拓哺,從而得到一個基本的URL標(biāo)準(zhǔn)格式。
支持的URL格式file脖母、ftp士鸥、gopher、hdl镶奉、http础淤、https、imap哨苛、mailto,mms币砂、news建峭、nntp、prospero决摧、rsync亿蒸、rtsp、rtspu掌桩、sftp边锁、shttp、sip波岛、sips茅坛、snews、svn则拷、svn+ssh贡蓖、telnet、wais煌茬、ws斥铺、wss
URL parsing(URL解析)
URL parsing函數(shù)注重將URL字符串分號才能組件,或者將組件合并成一個URL
urllib.parse.urlparse(urlstring,scheme='',allow_fragments=True)
包含六個部分坛善,元組中每一個元素都是一個字符串晾蜘,可以為空邻眷,這六個部分均不能再被分割成更小的部分。
例如:
import urllib.parse
print(urllib.parse.urlparse("https://www.zhihu.com/question/50056807/answer/223566912"))
結(jié)果
ParseResult(scheme='https', netloc='www.zhihu.com', path='/question/50056807/answer/223566912', params='', query='', fragment='')
urllib.parse.urlunparsre(parts)
這個函數(shù)可以將urlparse()分解出來的元組組裝成URL
實例:
import urllib.parse
# print(urllib.parse.parse_qsl("FuncNo=9009001&username=1"))
parsed=urllib.parse.urlparse("https://www.zhihu.com/question/50056807/answer/223566912")
print(parsed)
# print(urllib.parse.parse_qs("https://www.zhihu.com/question/50056807/answer/223566912"))
# print(urllib.parse.parse_qs("FuncNo=9009001&username=1"))
t=parsed[:]
print(urllib.parse.urlunparse(t))
輸出結(jié)果:
ParseResult(scheme='https', netloc='www.zhihu.com', path='/question/50056807/answer/223566912', params='', query='', fragment='')
https://www.zhihu.com/question/50056807/answer/223566912