本文主要介紹Python的高級特性:列表推導式、迭代器和生成器产镐,是面試中經(jīng)常會被問到的特性隘庄。因為生成器實現(xiàn)了迭代器協(xié)議,可由列表推導式來生成癣亚,所有丑掺,這三個概念作為一章來介紹,是最便于大家理解的述雾,現(xiàn)在看不懂沒關系街州,下面我不僅是會讓大家知其然兼丰,重要的更是要知其所以然。
列表推導式
前幾天有個HR讓我談談列表推導式唆缴,我說這我經(jīng)常用鳍征,就是用舊的列表生成一個新的列表的公式,他直接就把我拒了琐谤,讓我回去復習一下蟆技,挺受打擊的,所以決定也幫助大家回顧一下斗忌。
內(nèi)容
- 列表推導式:舊的列表->新的列表
- 了解:字典推導式 集合推導式
1.列表推導式:
格式 [表達式 for 變量 in 舊列表]
或 [表達式 for 變量 in 舊列表 if 條件]
例1:生成名字長度大于3且首字母大寫的新列表质礼。
names_old = ['tom', 'amy', 'daming', 'lingling']
names_new = [name.capitalize() for name in names_old if len(name) > 3]
print(names_new)
輸出:
['Daming', 'Lingling']
例2: (大廠初級筆試題目)生成一個元組列表,要求每個元素為(0-5偶數(shù), 0-10奇數(shù))
形式织阳。輸出結果為:
[(0, 1), (0, 3), (0, 5), (0, 7), (0, 9), (2, 1), (2, 3), (2, 5), (2, 7), (2, 9), (4, 1), (4, 3), (4, 5), (4, 7), (4, 9)]
for循環(huán)實現(xiàn)代碼:
new_list = list()
for i in range(5): # 偶數(shù)
if i % 2 == 0:
for j in range(10): # 奇數(shù)
if j % 2 != 0:
new_list.append((i, j))
列表推導式代碼:
new_list = [(i, j) for i in range(5) for j in range(10) if i % 2 == 0 and j % 2 != 0]
例3:(大廠初級筆試題目)給出一個員工列表:
employees_old = [{'name': "tmo", "salary": 4800},
{'name': "amy", "salary": 3800},
{'name': "daming", "salary": 7000},
{'name': "lingling", "salary": 5600}]
如果員工薪資大于5000則加200眶蕉,否則加500,輸出新的員工列表唧躲。
列表推導式:
employees_new = [employee['salary'] + 200 if employee['salary'] > 5000 else employee['salary'] + 500 for employee in employees_old]
print(employees_new)
輸出:
[5300, 4300, 7200, 5800]
發(fā)現(xiàn)結果是員工薪資列表造挽,回過頭看一下代碼,確實是把得到的數(shù)字給了列表弄痹,那要返回員工列表要怎么實現(xiàn)呢饭入?讓我們用普通for循環(huán)的方式來進行一下對比:
for employee in employees_old:
if employee['salary'] > 5000:
employee['salary'] += 200
else:
employee['salary'] += 500
print(employees_old)
輸出:
[{'name': 'tmo', 'salary': 5300}, {'name': 'amy', 'salary': 4300}, {'name': 'daming', 'salary': 7200}, {'name': 'lingling', 'salary': 5800}]
沒錯,我們注意到兩者的差別了肛真,列表推導式我們少了一步賦值(在字典元素上進行賦值)谐丢,不能直接返回一個薪資數(shù)值而是一個員工字典給列表。正確的列表推導式如下:
employees_new = [
{'name': employee['name'], 'salary': employee['salary'] + 200} if employee['salary'] > 5000 else
{'name': employee['name'], 'salary': employee['salary'] + 500} for employee in employees_old]
print(employees_new)
2.字典推導式:
例1:
dict_old = {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'C'}
dict_new = {value: key for key, value in dict_old.items()}
print(dict_new)
輸出:
{'A': 'a', 'B': 'b', 'C': 'd'}
3.集合推導式:
類似列表推導式 典型用法:去重
例1:
list_old = [1, 2, 3, 5, 2, 3]
set_new = {x for x in list_old}
print(set_new)
輸出:
{1, 2 ,3, 5}
小結:
到目前為止蚓让,列表推導式不就是一個用來創(chuàng)建列表的式子么乾忱?除了可以簡化代碼,裝裝X历极?其實窄瘟,列表推導式還有另一個優(yōu)點是相比于for循環(huán)更高效,因為列表推導式在執(zhí)行時調用的是Python的底層C代碼趟卸,而for循環(huán)則是用Python代碼來執(zhí)行蹄葱。嗷~面試官最想聽到的,是第二點锄列。
迭代器
由于迭代器協(xié)議對很多人來說图云,是一個較為抽象的概念,而且生成器自動實現(xiàn)了迭代器協(xié)議右蕊,所以我們需要先講解一下迭代器協(xié)議的概念琼稻,也是為了更好的理解接下來的生成器。
概念
可以被next()
函數(shù)調用并不斷返回下一個值的對象稱為迭代器:Iterator饶囚。
迭代是訪問集合元素的一種方式帕翻,迭代器是一個可以記住遍歷位置的對象鸠补。迭代器對象從集合的第一個元素開始訪問,直到所有元素被訪問完結束嘀掸。
迭代器只能往前不能后退紫岩。
-
迭代器協(xié)議:是指對象需要提供
__next__()
方法,它要么返回迭代中的下一項睬塌,要么就引起一個StopIteration
異常泉蝌,以終止迭代。 - 可迭代對象:就是實現(xiàn)了迭代器協(xié)議的對象揩晴。
舉個例子勋陪,對Python稍微熟悉一點的朋友應該知道,Python的for循環(huán)不但可以用來遍歷list硫兰,還可以用來遍歷文件對象诅愚,如下所示:
with open('F:/test/test.txt') as f:
for line in f:
print(line)
為什么在Python中,文件還可以使用for循環(huán)進行遍歷呢劫映?這是因為违孝,在Python中,文件對象實現(xiàn)了迭代器協(xié)議泳赋,for循環(huán)并不知道它遍歷的是一個文件對象雌桑,它只管使用迭代器協(xié)議訪問對象即可。正是由于Python的文件對象實現(xiàn)了迭代器協(xié)議祖今,我們才得以使用如此方便的方式訪問文件校坑,如下所示:
with open('F:/test/test.txt') as f:
print(dir(f))
輸出:
['__class__', '__del__', '__dict__', '__dir__', '__init__', '__iter__', '__next__', 'closed', 'line_buffering', 'newlines', 'read', 'readline'......]
可迭代的是不是肯定就是迭代器?
- 生成器是可迭代的衅鹿,也是迭代器撒踪。
-
list
是可迭代的过咬,但不是迭代器大渤。list
可以借助iter()
函數(shù)將可迭代的變成迭代器list->iter(list)->迭代器next()
:
可迭代對象:
- 生成器
- 元組 列表 集合 字典 字符串
如何判斷一個對象是否是可迭代?
借助isinstance()
函數(shù):
from collections import Iterable
print(isinstance([x for x in range(10)], Iterable)) # 列表
print(isinstance('hello world', Iterable)) # 字符串
print(isinstance(100, Iterable)) # 數(shù)字
print(isinstance((x for x in range(10)), Iterable)) # 迭代器
輸出:
True
True
False
True
生成器
生成器是Python最有用的特性之一掸绞,也是使用的最不廣泛的Python特性之一泵三。究其原因,主要是因為衔掸,在其他主流語言里面沒有生成器的概念烫幕。正是由于生成器是一個“新”的東西,所以敞映,它一方面沒有引起廣大工程師的重視较曼,另一方面,也增加了工程師的學習成本振愿,最終導致大家錯過了Python中如此有用的一個特性捷犹。
概念
我們已經(jīng)知道弛饭,通過列表推導式可以直接創(chuàng)建一個列表,但是萍歉,受到內(nèi)存限制侣颂,列表容量肯定是有限的。而且枪孩,創(chuàng)建一個包含100萬個元素的列表憔晒,不僅占用很大的存儲空間,如果我們僅僅需要訪問前面那幾個元素蔑舞,那后面絕大多數(shù)元素占用的空間都白白浪費了拒担。所以,如果列表元素可以按照某種算法在循環(huán)的過程中不斷推算出后續(xù)的元素攻询,這樣既不必創(chuàng)建完整的list澎蛛,從而還可以節(jié)省大量的空間。在Python中蜕窿,這種一邊循環(huán)一邊計算的機制谋逻,稱為生成器:generator。
Python使用生成器對延遲操作提供了支持桐经。所謂延遲操作毁兆,是指在需要的時候才產(chǎn)生結果,而不是立即產(chǎn)生結果阴挣。這也是生成器的主要好處气堕。
定義生成器
Python有兩種不同的方式提供生成器:
方法一:借助列表推導式
生成器表達式:類似于列表推導(這也就是為什么第一節(jié)我要先介紹列表推導式),但是畔咧,生成器返回按需產(chǎn)生結果的一個對象茎芭,而不是一次構建一個結果列表。
例1:
my_generator = (x for x in range(5)) # 注意是()不是[]
print(my_generator) # 發(fā)現(xiàn)不能打印出元素
print(type(my_generator))
print(my_generator.__next__()) # 三種得到元素的方法誓沸,注意看輸出結果
print(next(my_generator))
for i in my_generator:
print(i)
# 注意會拋出StopIteration異常
# print(next(my_generator))
print(next(my_generator)) # generator只能遍歷一次
輸出:
Traceback (most recent call last):
File "E:/pycharm/Leetcode/RL_Learning/printdata.py", line 11, in <module>
print(next(my_generator))
StopIteration
<generator object <genexpr> at 0x0000000000513660>
<class 'generator'>
0
1
2
3
4
方法二:借助函數(shù)
生成器函數(shù):使用yield語句而不是return語句返回函數(shù)結果梅桩。yield語句一次返回一個結果,在每個結果中間拜隧,掛起函數(shù)的狀態(tài)宿百,起到暫停的作用,以便下次從它離開的地方繼續(xù)執(zhí)行洪添。
步驟:
- 定義函數(shù)垦页,函數(shù)返回使用
yield
關鍵字; - 調用函數(shù)干奢,接收函數(shù)返回值痊焊;
- 得到的返回結果就是生成器;
- 借助
next()
或__nest__()
得到想要的元素。
例2:你的函數(shù)里面只要出現(xiàn)了yield
關鍵字薄啥,你的函數(shù)就不再是函數(shù)了貌矿,就變成生成器了:
# 斐波那契數(shù)列:
def fib(length): # 1. 定義函數(shù)
a, b = 0, 1
n = 0
while n < length:
n += 1
yield b # return b + 暫停
a, b = b, a + b
g = fib(5) # 2. 調用函數(shù)
print(g) # 3. 返回的就是生成器
print(next(g)) # 4. 借助`next()`或`__nest__()`得到想要的元素
print(next(g)) # 每調用一次產(chǎn)生一個值
print(next(g))
print(g.__next__())
print(g.__next__())
輸出:
<generator object fib at 0x0000000001DDDFC0>
1
1
2
3
5
注意:生成器只能遍歷一次。
當調用函數(shù)的時候罪佳,并沒有進函數(shù)進行執(zhí)行逛漫,而是直接生成一個生成器,當調用next
的時候赘艳,才進入函數(shù)真正開始執(zhí)行酌毡,除了第一次調用next()
方法是從函數(shù)頭開始執(zhí)行,其余每次都是接著從上次執(zhí)行到yield
的地方接著執(zhí)行的蕾管。
小結:
使用生成器以后枷踏,代碼行數(shù)更少。大家要記住掰曾,如果想把代碼寫的Pythonic旭蠕,在保證代碼可讀性的前提下,代碼行數(shù)越少越好旷坦。
合理使用生成器掏熬,能夠有效提高代碼可讀性。只要大家完全接受了生成器的概念秒梅,理解了yield語句和return語句一樣旗芬,也是返回一個值。那么捆蜀,就能夠理解為什么使用生成器比不使用生成器要好疮丛,能夠理解使用生成器真的可以讓代碼變得清晰易懂。
在實際工作中辆它,充分利用Python生成器誊薄,不但能夠減少內(nèi)存使用,還能夠提高代碼可讀性锰茉。掌握生成器也是Python高手的標配呢蔫。如果本文對你有幫助,不要忘記關注點贊或收藏支持一下~