iterables(迭代器)
先看這段代碼:
>>> mylist1 = [1, 2, 3]
>>> for i in mylist1:
... print(i)
1
2
3
>>> mylist2 = [x for x in range(3)]
>>> for i in mylist2:
... print i
0
1
2
>>> s = ""
>>> for i in mylist2:
... s += str(i)
'012'
這段代碼的意思是list(列表)在python中是可以迭代的, 如果你需要一個接一個的訪問一個數(shù)據(jù)集合, 大多數(shù)的時候使用一個 for x in y 這種方式, 那么這里的 y 就是一個可以迭代訪問的數(shù)據(jù)集合, 很明顯list , tuple , string , file 這些都是迭代器
iterables 是保存在內(nèi)存中的, 你可以隨便訪問他們, 比如上面的 mylist1, mylist2
generators(生成器)
再看這一段:
>>> mygenerator = (x*x for x in range(3))
>>> for i in mygenerator:
... print(i)
0
1
4
>>> mygenerator
<generator object <genexpr> at 0x10d35eaa0>
>>> s = ""
>>> for i in mygenerator:
... s += str(i)
...
''
這段代碼中 mygenerator 就是一個迭代器, 跟上文的 mylist2 生成方式有點點區(qū)別, [] 改成了 (), 從使用上來說, generators 和 iterables 都是類似 for in 的這種方式
但是: generators 不是保存在內(nèi)存中的, 而是惰性加載的, 也就是你用到它的時候, 它才臨時去計算, 只能使用一次 for in , 比如上面的 mygenerator , 計算 00 并返回之后就不在保留了, 繼續(xù)計算 11
適用場景: 當需要迭代訪問一組量非常大的數(shù)據(jù)集的時候, generator 是非常有用的, 因為它計算完了前面的數(shù)據(jù)然后就計算后面, 并不在內(nèi)存里保留所有的數(shù)據(jù), 這樣就不至于內(nèi)存爆掉
yield
理解了 generator 之后, 再來看 yield 就非常好理解了, 可以把 yield 當成 return 看待
>>> def createGenerator():
... mylist = (x*x for x range(3))
... for i in mylist:
... yield i
...
>>> mygenerator = createGenerator() # 創(chuàng)建一個生成器
>>> print(mygenerator) # 生成器就是一個object
<generator object createGenerator at 0xb7555c34>
>>> for i in mygenerator:
... print(i)
0
1
4
>>> mygenerator = createGenerator()
>>> s = ""
>>> for i in mygenerator:
... s += str(i)
...
>>> s
'014'
上面的代碼中當調(diào)用 createGenerator() 的時候, 其實方法內(nèi)的代碼并沒有運行, 而在 for in 循環(huán)訪問的時候, 才開始從頭計算, 當運行到 yield 的時候返回第一個值, 然后就停下來, 當再次請求數(shù)據(jù)的時候繼續(xù)運算直到再次碰到 yield ... 直到?jīng)]有值可以返回