寫(xiě)在之前
我們都知道 Python 中內(nèi)置了許多標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu)胀瞪,比如列表熏瞄,元組脚祟,字典等。與此同時(shí)標(biāo)準(zhǔn)庫(kù)還提供了一些額外的數(shù)據(jù)結(jié)構(gòu)强饮,我們可以基于它們創(chuàng)建所需的新數(shù)據(jù)結(jié)構(gòu)由桌。
Python 附帶了一個(gè)「容器」模塊 collections,它包含了很多的容器數(shù)據(jù)類(lèi)型邮丰,今天我們來(lái)討論其中幾個(gè)常用的容器數(shù)據(jù)類(lèi)型行您,掌握了這幾個(gè)可以減少我們重復(fù)造輪子所帶來(lái)的煩擾。
namedtuple
相信你已經(jīng)熟悉了元組剪廉,一個(gè)元組相當(dāng)于一個(gè)不可變的列表娃循,你可以存儲(chǔ)一個(gè)數(shù)據(jù)的序列。這里要說(shuō)的 namedtuple(命名元組)和元組非常像斗蒋,它們都不能修改自己的數(shù)據(jù)捌斧。說(shuō)完了像,那么它們有哪些地方不像呢泉沾?
作為元組捞蚂,為了獲取其中的數(shù)據(jù),我們需要使用整數(shù)作為索引:
>>> people = ('Rocky', 'python')
>>> print(people[0])
Rocky
而 namedtuple 把元組變成了一個(gè)針對(duì)簡(jiǎn)單任務(wù)的容器跷究,我們不必使用整數(shù)索引來(lái)訪問(wèn) namedtuple 的數(shù)據(jù)姓迅,反而可以像用字典一樣訪問(wèn) namedtuple。
>>> from collections import namedtuple
>>> people = namedtuple('people', 'name age like')
>>> Rocky = people(name = 'rocky', age = 23, like = 'python')
>>> print(Rocky)
people(name='rocky', age=23, like='python')
>>> print(Rocky.name)
rocky
一個(gè) namedtuple 有兩個(gè)必須的參數(shù):元組名稱(chēng)和字段名稱(chēng)揭朝。在上面的代碼中队贱,我們的元組名稱(chēng)是 people,字段名稱(chēng)是 name潭袱,age柱嫌,like。nametuple 讓元組變的更加易讀屯换,很容易理解代碼是做什么的编丘,同樣我們也不用使用整數(shù)索引來(lái)訪問(wèn)一個(gè)命名元組(上面代碼我們用 name 訪問(wèn)了 namedtuple 中的數(shù)據(jù))与学,這讓我們的代碼更加容易維護(hù)。
但是你一定要記住的是嘉抓,雖然它的用法很爽索守,但它還是一個(gè)元組!所以屬性值在 namedtuple 中是不可變的抑片。
我們?cè)谏厦嬲f(shuō)過(guò)可以像用字典一樣訪問(wèn) namedtuple卵佛,那么當(dāng)然也可以把它轉(zhuǎn)為字典,具體操作如下所示:
>>> from collections import namedtuple
>>> people = namedtuple('people', 'name age like')
>>> Rocky = people(name = 'rocky', age = 23, like = 'python')
>>> print(Rocky._asdict())
OrderedDict([('name', 'rocky'), ('age', 23), ('like', 'python')])
defaultdict
我之前在使用字典的時(shí)候相當(dāng)隨意敞斋,只是隨便 dict 一下就好了截汪,然而這樣使用存在一個(gè)問(wèn)題:當(dāng)使用的 key 不存在的時(shí)候會(huì)報(bào) KeyError,而 defaultdict 就比較厲害了植捎,我們完全不需要檢查 key 是否存在衙解,所以我們能像下面這樣做的隨心所欲:
from collections import defaultdict
languages = (
('rocky', 'python'),
('snow', 'c'),
('leey', 'java'),
('rocky', 'c++'),
('leey', 'c#')
)
favourite = defaultdict(list)
for name, language in languages:
favourite[name].append(language)
print(favourite)
輸出如下所示:
defaultdict(<type 'list'>, {'leey': ['java', 'c#'], 'rocky': ['python', 'c++'], 'snow': ['c']})
然后我們?cè)倩氐健版I不存在,會(huì)觸發(fā) KeyError 異逞媸啵”這個(gè)問(wèn)題上來(lái)蚓峦,我們先來(lái)看 dict 觸發(fā) KeyError 的例子:
my_dict = {}
my_dict['name']['like'] = 'python'
輸出如下:
KeyError: 'name'
defaultdict 則用了一個(gè)非常巧妙的方式繞過(guò)了這個(gè)問(wèn)題,請(qǐng)看下面的操作:
import collections
language = lambda : collections.defaultdict(language)
my_dict = language()
my_dict['name']['like'] = 'python'
運(yùn)行一下顯示正常济锄,我們可以用 json.dumps 打印出 my_dict 的內(nèi)容:
import json
print(json.dumps(my_dict))
運(yùn)行結(jié)果如下:
{"name": {"like": "python"}}
Counter
Counter 是一個(gè)計(jì)數(shù)器暑椰,它可以幫助我們針對(duì)某項(xiàng)數(shù)據(jù)進(jìn)行計(jì)數(shù),比如可以用它來(lái)統(tǒng)計(jì)每個(gè)人擅長(zhǎng)的編程語(yǔ)言:
from collections import Counter
languages = (
('rocky', 'python'),
('snow', 'c'),
('leey', 'java'),
('rocky', 'c++'),
('leey', 'c#')
)
cnt = Counter(name for name, language in languages)
print(cnt)
運(yùn)行結(jié)果如下所示:
Counter({'leey': 2, 'rocky': 2, 'snow': 1})
當(dāng)然我們也可以用它來(lái)統(tǒng)計(jì)一個(gè)文件荐绝,比如:
from collections import Counter
with open('test.txt', 'rb') as f:
line_cnt = Counter(f)
print(line_cnt)
deque
deque 提供了一個(gè)雙端隊(duì)列干茉,我們可以在首尾兩端添加或者刪除元素,在前面的文章中(Python 標(biāo)準(zhǔn)庫(kù)之雙端隊(duì)列)寫(xiě)過(guò)很泊,沒(méi)看過(guò)的可以看看角虫。
想要使用 deque,首先我們要從 collections 中導(dǎo)入 deque 模塊委造,然后創(chuàng)建一個(gè) deque 對(duì)象戳鹅,它的用法就像我們前面學(xué)過(guò)的 list 一樣,并且提供了類(lèi)似的方法昏兆,具體如下所示:
from collections import deque
deq = deque()
deq.append(1)
deq.append(2)
deq.append(3)
print(deq)
print(len(deq))
print(deq[0])
print(deq[-1])
輸出結(jié)果如下:
deque([1, 2, 3])
3
1
3
我們可以從兩端取出數(shù)據(jù):
from collections import deque
deq = deque(range(5))
print('len(deq) == {}'.format(len(deq)))
deq.popleft()
deq.pop()
print(deq)
輸出的結(jié)果如下所示:
len(deq) == 5
deq == deque([1, 2, 3])
我們也可以對(duì)這個(gè)列表的大小進(jìn)行限制枫虏,當(dāng)超出我們的限制的時(shí)候,數(shù)據(jù)會(huì)從另一端被 pop 出去爬虱,具體我們來(lái)看下面的操作:
from collections import deque
deq = deque(maxlen=3)
deq.append(1)
deq.append(2)
deq.append(3)
print(deq)
deq.append(4)
print (deq)
輸出的結(jié)果如下:
deque([1, 2, 3], maxlen=3)
deque([2, 3, 4], maxlen=3)
當(dāng)超出 maxlen 的值時(shí)隶债,最左邊的數(shù)據(jù)將從隊(duì)列中刪除。
當(dāng)然我們還可以從任意一端擴(kuò)展這個(gè)雙端隊(duì)列中的數(shù)據(jù):
from collections import deque
deq = deque([1,2,3])
deq.extendleft([0])
deq.extend([4,5,6])
print(deq)
輸出的結(jié)果如下所示:
deque([0, 1, 2, 3, 4, 5, 6])
如果有那些不足的地方跑筝,歡迎大家補(bǔ)充死讹!