正則表達(dá)式與 JSON
初識(shí)正則表達(dá)式
正則表達(dá)式是一個(gè)特殊的字符序列乘粒,可以檢查一個(gè)字符串是否與我們所設(shè)定的字符序列想匹配
可以用來(lái)快速檢索文本和替換文本
比如豌注,檢查一串?dāng)?shù)字是不是電話號(hào)碼,檢查一個(gè)字符串是不是 email谓厘,把一個(gè)文本中指定的單詞替換為另外一個(gè)單詞
一個(gè)例子:一個(gè)字符串是否包含另一個(gè)字符串
# 檢查字符串 a 中是否包含 python
a = 'c|c++|go|python|Javascript'
# 使用 python 自帶的 in 來(lái)操作
print('python' in a)
# 使用正則表達(dá)式來(lái)操作
import re
r = re.findall('python', a)
print(r)
結(jié)果
True
['python']
一個(gè)例子:提取字符串 a 中的所有數(shù)字
import re
a = 'c0c++7go8python6Javascript'
r = re.findall('\d', a)
print(r)
結(jié)果
['0', '7', '8', '6']
第一個(gè)例子中的正則表達(dá)式 python
和第二個(gè)例子中的正則表達(dá)式 \d
幌羞,分別稱為普通字符和元字符。
字符集
import re
s = 'abc, acc, adc, aec, afc, ahc'
# 找出字符串 s 中竟稳,中間是 c 或 f 的單詞
r = re.findall('a[cf]c', s)
print(r)
# 找出 中間不是 c 或 f 的單詞
r = re.findall('a[^cf]c', s)
print(r)
# 找出 中間是 c 或 d 或 e 或 f 的單詞
r = re.findall('a[c-f]c', s)
print(r)
結(jié)果
['acc', 'afc']
['abc', 'adc', 'aec', 'ahc']
['acc', 'adc', 'aec', 'afc']
概括字符集
[\d]
數(shù)字字符属桦,是 [0-9]
的概括字符集熊痴,[\D]
是 [\d
] 的取反
[\w]
單詞字符,是 [A-Za-z0-9_]
的概括字符集聂宾,[\W]
是 [\w]
的取反果善,包括 [' ', '\t', '&', '\n', '\r']
[\s]
空白字符,匹配空白字符系谐,包括 ' ', '\t', \n', '\r'
巾陕, [\S]
匹配非空白字符
數(shù)量詞
匹配字符串中的語(yǔ)言名稱
import re
a = 'python 1111php678go'
r = re.findall('[a-z]{2,6}', a)
print(r)
結(jié)果
['python', 'php', 'go']
貪婪與非貪婪
默認(rèn)是貪婪匹配,盡可能多的匹配纪他,比如上面的例子中 [a-z]{2,6}
就會(huì)盡可能多的匹配到 6
非貪婪匹配鄙煤,使用問(wèn)號(hào) [a-z]{2,6}?
import re
a = 'python 1111php678go'
r = re.findall('[a-z]{2,6}?', a)
print(r)
結(jié)果
['py', 'th', 'on', 'ph', 'go']
匹配 0 次 1 次或者無(wú)限多次
*
對(duì)前面的一個(gè)字符,匹配 0 次或 無(wú)限多 次
import re
a = 'pytho1python2pythonn3'
r = re.findall('python*', a)
print(r)
結(jié)果
['pytho', 'python', 'pythonn']
+
對(duì)前面的一個(gè)字符茶袒,匹配 1 次或 無(wú)限多 次
import re
a = 'pytho1python2pythonn3'
r = re.findall('python+', a)
print(r)
結(jié)果
['python', 'pythonn']
?
對(duì)前面的一個(gè)字符梯刚,匹配 0 次或 1 次
import re
a = 'pytho1python2pythonn3'
r = re.findall('python?', a)
print(r)
結(jié)果
['pytho', 'python', 'python']
邊界匹配符
^
從字符串的開(kāi)頭開(kāi)始匹配
$
從字符串的末尾開(kāi)始匹配
匹配長(zhǎng)度為 4~8 位的字符
import re
qq = '123456789'
r = re.findall('^\d{4,8}$', qq)
print(r)
結(jié)果
[]
組
()
組
[]
字符集,中的每個(gè)字符是或的關(guān)系薪寓,()
組亡资,中的每個(gè)字符是且的關(guān)系
3 個(gè) python 匹配 1 次:
import re
a = 'PythonPythonPythonPythonPythonPython'
r = re.findall('(Python){3}', a)
print(r)
結(jié)果
['Python', 'Python']
匹配模式參數(shù)
小寫(xiě)匹配大寫(xiě)
import re
lanuage = 'PYTHON'
r = re.findall('python', lanuage)
print(r)
結(jié)果,匹配不到
[]
忽略大小寫(xiě)
import re
lanuage = 'PYTHON'
r = re.findall('python', lanuage, re.I)
print(r)
結(jié)果
['PYTHON']
.
匹配出換行符 \n
之外其他所有字符
用 .
匹配換行符:
import re
lanuage = 'PYTHON\n'
r = re.findall('python.', lanuage, re.I)
print(r)
結(jié)果向叉,匹配不到
[]
匹配換行符:
import re
lanuage = 'PYTHON\n'
r = re.findall('python.', lanuage, re.I | re.S)
print(r)
結(jié)果
['PYTHON\n']
re.sub 正則替換
匹配到锥腻,替換。
re.sub('要匹配的', '替換為', 字符串)
import re
lanuage = 'PythonC++JavaPHPJava'
r = re.sub('Java', 'GO', lanuage)
print(r)
結(jié)果
PythonC++GOPHPGO
只替換匹配到的第一個(gè)
import re
lanuage = 'PythonC++JavaPHPJava'
r = re.sub('Java', 'GO', lanuage, 1)
print(r)
結(jié)果
PythonC++GOPHPJava
第二個(gè)參數(shù)母谎,可以是一個(gè)函數(shù)
import re
lanuage = 'PythonC++GOPHPGO'
def convert(value):
# value 是匹配到的對(duì)象
print(value)
matched = value.group()
# return 是替換為
return '>' + matched + '<'
r = re.sub('GO', convert, lanuage)
print(r)
結(jié)果
<re.Match object; span=(9, 11), match='GO'>
<re.Match object; span=(14, 16), match='GO'>
PythonC++>GO<PHP>GO<
一個(gè)字符串瘦黑,匹配其中的數(shù)字,大于 6 的替換成 9销睁,小于 6 的替換成 0:
import re
s = 'A8C3721D86'
def convert(value):
matched = value.group()
if int(matched) >= 6:
return '9'
else:
return '0'
r = re.sub('\d', convert, s)
print(r)
結(jié)果
A9C0900D99
Search 與 match 函數(shù)
re.match()
從首字符開(kāi)始匹配供璧,如果首字符不匹配,就返回 None
冻记,匹配到就返回匹配到的對(duì)象睡毒,只匹配一次
re.search()
搜索整個(gè)字符串,返回匹配到的第一個(gè)對(duì)象
group 分組
不要首尾
import re
s = 'life is short, i use python'
r = re.search('life(.*)python', s)
print(r.group(1))
結(jié)果
is short, i use
用 findall()
不需要使用 group()
import re
s = 'life is short, i use python'
r = re.findall('life(.*)python', s)
print(r)
結(jié)果
[' is short, i use ']
多個(gè)分組
import re
s = 'life is short, i use python, i love python'
r = re.search('life(.*)python(.*)python', s)
print(r.group(0))
print(r.group(1))
print(r.group(2))
print(r.groups())
結(jié)果
life is short, i use python, i love python
is short, i use
, i love
(' is short, i use ', ', i love ')
理解 JSON
一種輕量級(jí)的數(shù)據(jù)交換格式
- 易于閱讀
- 易于解析
- 網(wǎng)絡(luò)傳輸效率高
- 跨語(yǔ)言交換數(shù)據(jù)
json 有自己的數(shù)據(jù)類(lèi)型
Json | Python |
---|---|
object | dict |
array | list |
string | str |
number | int |
number | float |
true | True |
false | False |
null | None |
反序列化
import json
json_object = '{"name":"張三", "age":18}'
student = json.loads(json_str)
print(type(student))
print(student)
print(student['name'])
print(student['age'])
結(jié)果
<class 'dict'>
{'name': '張三', 'age': 18}
張三
18
import json
json_array = '[{"name":"張三","age":18, "flag":false}, {"name":"小明", "age":18, "flag":true}]'
student = json.loads(json_array)
print(type(student))
print(student)
結(jié)果
<class 'list'>
[{'name': '張三', 'age': 18, 'flag': False}, {'name': '小明', 'age': 18, 'flag': True}]
序列化
import json
student = [{'name': 'zhangsan', 'age': 18, 'flag': False}, {'name': 'xiaoming', 'age': 19, 'flag': True}]
json_array = json.dumps(student)
print(type(json_array))
print(json_array)
結(jié)果
<class 'str'>
[{"name": "zhangsan", "age": 18, "flag": false}, {"name": "xiaoming", "age": 19, "flag": true}]
枚舉和閉包
枚舉其實(shí)是一個(gè)類(lèi)
from enum import Enum
class VIP(Enum):
YELLOW = 1
GREEN = 2
BLACK = 3
RED = 4
print(VIP.YELLOW)
結(jié)果
VIP.YELLOW
枚舉和普通類(lèi)相比的優(yōu)勢(shì)
普通類(lèi)的類(lèi)變量冗栗,可修改演顾,變量名可重復(fù)
枚舉類(lèi)的類(lèi)變量,不可修改隅居,變量名不可重復(fù)
修改普通類(lèi)的類(lèi)變量
class Common:
YELLOW = 1
Common.YELLOW = 6
print(Common.YELLOW)
結(jié)果
6
修改枚舉類(lèi)的類(lèi)變量
from enum import Enum
class VIP(Enum):
YELLOW = 1
GREEN = 2
BLACK = 3
RED = 4
VIP.YELLOW = 6
結(jié)果
AttributeError: Cannot reassign members.
普通類(lèi)的變量名可以重復(fù)
class Common:
YELLOW = 1
YELLOW = 1
print(Common.YELLOW)
結(jié)果
1
枚舉類(lèi)的變量名不可重復(fù)
from enum import Enum
class VIP(Enum):
YELLOW = 1
YELLOW = 2
BLACK = 3
RED = 4
print(VIP.YELLOW)
結(jié)果
TypeError: Attempted to reuse key: 'YELLOW'
枚舉類(lèi)型钠至、枚舉名稱與枚舉值
獲取 枚舉值 和 枚舉名稱
from enum import Enum
class VIP(Enum):
YELLOW = 1
GREEN = 2
BLACK = 3
RED = 4
print(VIP.YELLOW.value)
print(VIP.YELLOW.name)
結(jié)果
1
YELLOW
枚舉名稱和枚舉類(lèi)型不同
from enum import Enum
class VIP(Enum):
YELLOW = 1
GREEN = 2
BLACK = 3
RED = 4
# 枚舉名稱
print(VIP.YELLOW.name)
# 枚舉類(lèi)型
print(VIP.YELLOW)
print(type(VIP.YELLOW.name))
print(type(VIP.YELLOW))
# 通過(guò)枚舉名稱獲取枚舉類(lèi)型
print(VIP['YELLOW'])
結(jié)果
YELLOW
VIP.YELLOW
<class 'str'>
<enum 'VIP'>
VIP.YELLOW
枚舉可以遍歷
通過(guò)遍歷枚舉,獲取到這個(gè)枚舉下面的所有枚舉類(lèi)型
from enum import Enum
class VIP(Enum):
YELLOW = 1
GREEN = 2
BLACK = 3
RED = 4
for v in VIP:
print(v)
結(jié)果
VIP.YELLOW
VIP.GREEN
VIP.BLACK
VIP.RED
枚舉的比較運(yùn)算
枚舉的注意事項(xiàng)
枚舉類(lèi)型的值可以重復(fù)胎源,不過(guò)此時(shí)后一個(gè)可以看做是前一個(gè)的別名
from enum import Enum
class VIP(Enum):
YELLOW = 1
GREEN = 1
BLACK = 3
RED = 4
print(VIP.GREEN)
結(jié)果
VIP.YELLOW
在遍歷的時(shí)候棉钧,別名不會(huì)遍歷出來(lái)
...
for v in VIP:
print(v)
結(jié)果
VIP.YELLOW
VIP.BLACK
VIP.RED
如果需要遍歷出來(lái):
...
for v in VIP.__members__.items():
print(v)
結(jié)果
('YELLOW', <VIP.YELLOW: 1>)
('GREEN', <VIP.YELLOW: 1>)
('BLACK', <VIP.BLACK: 3>)
('RED', <VIP.RED: 4>)
也可以不加 items()
:
...
for v in VIP.__members__:
print(v)
結(jié)果
YELLOW
GREEN
BLACK
RED
通過(guò)枚舉值獲取枚舉名
數(shù)據(jù)庫(kù)中存枚舉值,因?yàn)檎加每臻g小涕蚤,代碼中使用枚舉名宪卿,因?yàn)榭勺x性高
通過(guò)枚舉值獲取枚舉名
from enum import Enum
class VIP(Enum):
YELLOW = 1
GREEN = 1
BLACK = 3
RED = 4
a = 1
print(VIP(a))
結(jié)果
VIP.YELLOW
枚舉小結(jié)
Enum
的枚舉值可以是字符串的诵,如果只有數(shù)值類(lèi)型的枚舉值,可以使用 IntEnum
@unique
可以防止枚舉值相同
枚舉類(lèi)不能實(shí)例化
一切皆對(duì)象
python 中一切皆對(duì)象
函數(shù)也是對(duì)象佑钾,可以賦值給變量西疤,可以作為另一個(gè)函數(shù)的參數(shù),可以作為另一個(gè)函數(shù)的返回值
函數(shù)也是對(duì)象:
def a():
pass
print(type(a))
結(jié)果
<class 'function'>
什么是閉包
調(diào)用函數(shù) curve
def a():
def b():
pass
b()
結(jié)果
NameError: name 'b' is not defined
因?yàn)楹瘮?shù) curve
的作用域只在函數(shù) curve_pre
內(nèi)部休溶。
函數(shù)可以作為另一個(gè)函數(shù)的返回值代赁,也可以賦值給變量
def a():
def b():
print('This is a function')
# 函數(shù)可以作為另一個(gè)函數(shù)的返回值
return b
# 函數(shù)可以賦值給變量
f = a()
# f() 相當(dāng)于 b()
f()
結(jié)果
This is a function
傳個(gè)參數(shù)
def a():
x = 1
def b(y):
return x + y
# 函數(shù)可以作為另一個(gè)函數(shù)的返回值
return b
# 函數(shù)可以賦值給變量
f = a()
# f(2) 相當(dāng)于 b(2)
result = f(2)
print(result)
結(jié)果
3
閉包 = 函數(shù) + 環(huán)境變量
在上面的代碼中,return b
其實(shí)并不只是返回了函數(shù) b
兽掰,與函數(shù) b
一起返回的芭碍,還有它的環(huán)境變量 x = 1
,它們是一個(gè)整體禾进,也就是一個(gè)閉包豁跑。
獲取這個(gè)環(huán)境變量的值:
...
print(f.__closure__[0].cell_contents)
結(jié)果
1
一個(gè)示例看看閉包
def f1():
a = 10
def f2():
a = 20
print(a)
print(a)
f2()
print(a)
f1()
結(jié)果
10
20
10
閉包的經(jīng)典誤區(qū)
如果函數(shù)對(duì)它的環(huán)境變量重新賦值,那么這個(gè)變量會(huì)變成一個(gè)普通的局部變量
def f1():
a = 10
def f2():
# 對(duì)環(huán)境變量重新賦值泻云,a 會(huì)被 python 認(rèn)為是一個(gè)局部變量
a = 20
return a
return f2
f = f1()
print(f.__closure__)
結(jié)果
None
閉包解決問(wèn)題
計(jì)算步數(shù)
初始步數(shù) x = 0 ,走 3 步 result = 3狐蜕,停一停宠纯,走 5 步,result = 8层释,休息一下婆瓜,走 3 步, result = 11
不使用閉包的實(shí)現(xiàn)方法
steps = 0
def go(step):
global steps
steps += step
return steps
result1 = go(3)
print(result1)
result2 = go(5)
print(result2)
result3 = go(3)
print(result3)
結(jié)果
3
8
11
使用閉包實(shí)現(xiàn)
steps = 0
def factory(steps):
def go(step):
# 聲明 steps 不是局部變量
nonlocal steps
steps += step
return steps
return go
# 調(diào)用 factory 函數(shù)
g = factory(steps)
# 第一次調(diào)用 go 函數(shù)
result1 = g(3)
# 結(jié)果
print(result1)
# 環(huán)境變量
print(g.__closure__[0].cell_contents)
# 全局變量
print(steps)
result2 = g(5)
print(result2)
print(g.__closure__[0].cell_contents)
print(steps)
result3 = g(3)
print(result3)
print(g.__closure__[0].cell_contents)
print(steps)
結(jié)果
3
3
0
8
8
0
11
11
0
全局變量 steps = 0
始終沒(méi)有被改變贡羔,這是使用閉包的好處廉白,因?yàn)槿绻總€(gè)函數(shù)都修改全局變量,容易亂乖寒。