1 迭代器(iterators)
根據(jù)維基百科葡盗,迭代器是一個讓程序員可以遍歷一個容器(特別是列表)的對象尘盼。然而偷办,一個迭代器在遍歷并讀取一個容器的數(shù)據(jù)元素時统舀,并不會執(zhí)行一個迭代。
換句話說這里有三個部分:
- 可迭代對象(Iterable)
- 迭代器(Iterator)
- 迭代(Iteration)
上面這些部分互相聯(lián)系劳景。我們會先各個擊破來討論他們誉简,然后再討論生成器(generators)。
1.1 可迭代對象(Iterable)
Python中任意的對象盟广,只要它定義了可以返回一個迭代器的__iter__方法闷串,或者定義了可以支持下標(biāo)索引的__getitem__方法,那么它就是一個可迭代對象筋量。
簡單說烹吵,可迭代對象就是能提供迭代器的任意對象。那迭代器又是什么呢桨武?
1.2 迭代器(Iterator)
任意對象肋拔,只要定義了next(Python2) 或者_(dá)_next__方法,它就是一個迭代器呀酸。
就這么簡單凉蜂,現(xiàn)在我們來理解迭代(iteration)。
1.3 迭代(Iteration)
用簡單的話講,迭代就是從某個地方(比如一個列表)取出一個元素的過程窿吩。當(dāng)我們使用一個循環(huán)來遍歷某個東西時茎杂,這個過程本身就叫迭代。
現(xiàn)在既然我們有了這些術(shù)語的基本理解纫雁,那我們開始理解生成器吧煌往。
2 生成器(Generators)
生成器也是一種迭代器,但是你只能對其迭代一次轧邪。這是因為它們并沒有把所有的值存在內(nèi)存中刽脖,而是在運行時生成值。你通過遍歷來使用它們闲勺,要么用一個for循環(huán)曾棕,要么將它們傳遞給任意可以進行迭代的函數(shù)和結(jié)構(gòu)。
大多數(shù)時候生成器是以函數(shù)來實現(xiàn)的菜循。然而翘地,它們并不返回一個值,而是yield(暫且譯作“生出”)一個值癌幕。
這里有個生成器函數(shù)的簡單例子:
def generator_function():
for i in range(5):
yield i
for item in generator_function():
print(item)
# 輸出為:
0
1
2
3
4
這個案例并不是非常實用衙耕。生成器最佳應(yīng)用場景是:你不想同一時間將所有計算出來的大量結(jié)果集分配到內(nèi)存當(dāng)中,特別是結(jié)果集里還包含循環(huán)勺远。
許多Python 2里的標(biāo)準(zhǔn)庫函數(shù)都會返回列表橙喘,而Python 3都修改成了返回生成器,因為生成器占用更少的資源胶逢。
下面是一個計算斐波那契數(shù)列的生成器:
def fibon(n):
a = b = 1
for i in range(n):
yield a
a, b = b, a + b
函數(shù)使用方法如下:
for x in fibon(1000000):
print(x)
用這種方式厅瞎,我們可以不用擔(dān)心它會使用大量資源。然而初坠,之前如果我們這樣來實現(xiàn)的話:
def fibon(n):
a = b = 1
result = []
for i in range(n):
result.append(a)
a, b = b, a + b
return result
這也許會在計算很大的輸入?yún)?shù)時和簸,用盡所有的資源。
我們已經(jīng)討論過生成器使用一次迭代碟刺,但我們并沒有測試過锁保。在測試前你需要再知道一個Python內(nèi)置函數(shù):next()。它允許我們獲取一個序列的下一個元素半沽。
那我們來驗證下我們的理解:
def generator_function():
for i in range(3):
yield i
gen = generator_function()
print(next(gen)) # Output: 0
print(next(gen)) # Output: 1
print(next(gen)) # Output: 2
print(next(gen))
# 輸出為:
StopIteration Traceback (most recent call last)
<ipython-input-6-32965fef91fa> in <module>()
----> 1 print(next(gen))
StopIteration:
我們可以看到爽柒,在yield掉所有的值后,next()觸發(fā)了一個StopIteration的異常者填『拼澹基本上這個異常告訴我們,所有的值都已經(jīng)被yield完了占哟。
你也許會奇怪穴亏,為什么我們在使用for循環(huán)時沒有這個異常呢蜂挪?啊哈,答案很簡單嗓化。for循環(huán)會自動捕捉到這個異常并停止調(diào)用next()棠涮。
你知不知道Python中一些內(nèi)置數(shù)據(jù)類型也支持迭代哦?我們這就去看看:
my_string = "google"
for char in my_string:
print(char)
# 輸出為:
g
o
o
g
l
e
my_string = "google"
next(my_string)
# 輸出為:
TypeError Traceback (most recent call last)
<ipython-input-7-3c32420c5c24> in <module>()
1 my_string = "google"
----> 2 next(my_string)
TypeError: str object is not an iterator
好吧刺覆,這不是我們預(yù)期的严肪。這個異常說那個str對象不是一個迭代器。對,就是這樣!str是一個可迭代對象遗遵,而不是一個迭代器趋厉。這意味著它支持迭代沃测,但我們不能直接對其進行迭代操作。
那我們怎樣才能對它實施迭代呢?是時候?qū)W習(xí)下另一個內(nèi)置函數(shù):iter。它將根據(jù)一個可迭代對象返回一個迭代器對象帘睦。
這里是我們?nèi)绾问褂盟?/p>
my_string = "google"
my_iter = iter(my_string)
next(my_iter) # Output: 'g'
現(xiàn)在好多啦。我肯定你已經(jīng)愛上了學(xué)習(xí)生成器坦康。一定要記住竣付,想要完全掌握這個概念,你只有使用它滞欠。確保你按照這個模式古胆,并在生成器對你有意義的任何時候都使用它。你絕對不會失望的筛璧!