什么是dict
我們已經(jīng)知道,list 和 tuple 可以用來(lái)表示順序集合辽俗,例如贤重,班里同學(xué)的名字:
['Adam', 'Lisa', 'Bart']
或者考試的成績(jī)列表:
[95, 85, 59]
但是漾肮,要根據(jù)名字找到對(duì)應(yīng)的成績(jī),用兩個(gè) list 表示就不方便灸眼。
如果把名字和分?jǐn)?shù)關(guān)聯(lián)起來(lái)卧檐,組成類似的查找表:
'Adam' ==> 95
'Lisa' ==> 85
'Bart' ==> 59
給定一個(gè)名字,就可以直接查到分?jǐn)?shù)焰宣。
Python的 dict 就是專門干這件事的霉囚。用dict表示“名字”-“成績(jī)”的查找表如下:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
我們把名字稱為key,對(duì)應(yīng)的成績(jī)稱為value匕积,dict就是通過(guò)key來(lái)查找value盈罐。
花括號(hào){}表示這是一個(gè)dict,然后按照key: value, 寫出來(lái)即可闸天。最后一個(gè) key: value 的逗號(hào)可以省略暖呕。
由于dict也是集合,len()函數(shù)可以計(jì)算任意集合的大邪:
>>> len(d)
3
注意:一個(gè) key-value 算一個(gè)湾揽,因此,dict大小為3笼吟。
任務(wù):
新來(lái)的Paul同學(xué)成績(jī)是 75 分库物,請(qǐng)編寫一個(gè)dict,把Paul同學(xué)的成績(jī)也加進(jìn)去贷帮。
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
訪問(wèn)dict
我們已經(jīng)能創(chuàng)建一個(gè)dict戚揭,用于表示名字和成績(jī)的對(duì)應(yīng)關(guān)系:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
那么,如何根據(jù)名字來(lái)查找對(duì)應(yīng)的成績(jī)呢撵枢?
可以簡(jiǎn)單地使用d[key]的形式來(lái)查找對(duì)應(yīng)的 value民晒,這和 list 很像,不同之處是锄禽,list 必須使用索引返回對(duì)應(yīng)的元素潜必,而dict使用key:
>>> print d['Adam']
95
>>> print d['Paul']
Traceback (most recent call last):
File "index.py", line 11, in
print d['Paul']
KeyError: 'Paul'
注意:通過(guò) key 訪問(wèn) dict 的value,只要 key 存在沃但,dict就返回對(duì)應(yīng)的value磁滚。如果key不存在,會(huì)直接報(bào)錯(cuò):KeyError。
要避免 KeyError 發(fā)生垂攘,有兩個(gè)辦法:
一是先判斷一下 key 是否存在维雇,用 in 操作符:
if 'Paul' in d:
print d['Paul']
如果 'Paul' 不存在,if語(yǔ)句判斷為False晒他,自然不會(huì)執(zhí)行 print d['Paul'] 吱型,從而避免了錯(cuò)誤。
二是使用dict本身提供的一個(gè) get 方法陨仅,在Key不存在的時(shí)候唁影,返回None:
>>> print d.get('Bart')
59
>>> print d.get('Paul')
None
任務(wù)
根據(jù)如下dict:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
請(qǐng)打印出:
Adam: 95
Lisa: 85
Bart: 59
代碼如下:
%s代表字符串,%d代表整數(shù)數(shù)字掂名,百分號(hào)后面的元組(key, d[key])
dict的特點(diǎn)
dict的第一個(gè)特點(diǎn)是查找速度快据沈,無(wú)論dict有10個(gè)元素還是10萬(wàn)個(gè)元素,查找速度都一樣饺蔑。而list的查找速度隨著元素增加而逐漸下降锌介。
不過(guò)dict的查找速度快不是沒(méi)有代價(jià)的,dict的缺點(diǎn)是占用內(nèi)存大猾警,還會(huì)浪費(fèi)很多內(nèi)容孔祸,list正好相反,占用內(nèi)存小发皿,但是查找速度慢崔慧。
由于dict是按 key 查找,所以穴墅,在一個(gè)dict中惶室,key不能重復(fù)。
dict的第二個(gè)特點(diǎn)就是存儲(chǔ)的key-value序?qū)κ菦](méi)有順序的玄货!這和list不一樣:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
當(dāng)我們?cè)噲D打印這個(gè)dict時(shí):
>>> print d
{'Lisa': 85, 'Adam': 95, 'Bart': 59}
打印的順序不一定是我們創(chuàng)建時(shí)的順序皇钞,而且,不同的機(jī)器打印的順序都可能不同松捉,這說(shuō)明dict內(nèi)部是無(wú)序的夹界,不能用dict存儲(chǔ)有序的集合。
dict的第三個(gè)特點(diǎn)是作為 key 的元素必須不可變隘世,Python的基本類型如字符串可柿、整數(shù)、浮點(diǎn)數(shù)都是不可變的丙者,都可以作為 key复斥。但是list是可變的,就不能作為 key蔓钟。
可以試試用list作為key時(shí)會(huì)報(bào)什么樣的錯(cuò)誤永票。
不可變這個(gè)限制僅作用于key卵贱,value是否可變無(wú)所謂:
{? ? '123': [1, 2, 3],# key 是 str滥沫,value是list
123: '123',# key 是 int侣集,value 是 str
('a', 'b'): True# key 是 tuple,并且tuple的每個(gè)元素都是不可變對(duì)象兰绣,value是 boolean}
最常用的key還是字符串世分,因?yàn)橛闷饋?lái)最方便。
任務(wù):
請(qǐng)?jiān)O(shè)計(jì)一個(gè)dict缀辩,可以根據(jù)分?jǐn)?shù)來(lái)查找名字臭埋,已知成績(jī)?nèi)缦拢?/p>
Adam: 95,
Lisa: 85,
Bart: 59.
更新dict
dict是可變的封锉,也就是說(shuō)楚殿,我們可以隨時(shí)往dict中添加新的 key-value湃番。比如已有dict:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
要把新同學(xué)'Paul'的成績(jī) 72 加進(jìn)去涎跨,用賦值語(yǔ)句:
>>> d['Paul'] = 72
再看看dict的內(nèi)容:
>>> print d
{'Lisa': 85, 'Paul': 72, 'Adam': 95, 'Bart': 59}
如果 key 已經(jīng)存在像啼,則賦值會(huì)用新的 value 替換掉原來(lái)的 value:
>>> d['Bart'] = 60
>>> print d
{'Lisa': 85, 'Paul': 72, 'Adam': 95, 'Bart': 60}
任務(wù):
請(qǐng)根據(jù)Paul的成績(jī) 72 更新下面的dict:
d = {
95: 'Adam',
85: 'Lisa',
59: 'Bart'
}
代碼如下:
遍歷dict
由于dict也是一個(gè)集合回溺,所以沟蔑,遍歷dict和遍歷list類似求类,都可以通過(guò) for 循環(huán)實(shí)現(xiàn)累贤。
直接使用for循環(huán)可以遍歷 dict 的 key:
>>> d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
>>> for key in d:
...? ? print key
...
Lisa
Adam
Bart
由于通過(guò) key 可以獲取對(duì)應(yīng)的 value叠穆,因此,在循環(huán)體內(nèi)臼膏,可以獲取到value的值硼被。
任務(wù):
請(qǐng)用 for 循環(huán)遍歷如下的dict,打印出name: score來(lái)渗磅。
d = {'Adam': 95,? ? 'Lisa': 85,? ? 'Bart': 59}
代碼如下:
什么是set
dict的作用是建立一組 key 和一組 value 的映射關(guān)系嚷硫,dict的key是不能重復(fù)的。
有的時(shí)候始鱼,我們只想要 dict 的 key论巍,不關(guān)心 key 對(duì)應(yīng)的 value,目的就是保證這個(gè)集合的元素不會(huì)重復(fù)风响,這時(shí)嘉汰,set就派上用場(chǎng)了。
set 持有一系列元素状勤,這一點(diǎn)和 list 很像鞋怀,但是set的元素沒(méi)有重復(fù),而且是無(wú)序的持搜,這點(diǎn)和 dict 的 key很像密似。
創(chuàng)建 set 的方式是調(diào)用 set() 并傳入一個(gè) list,list的元素將作為set的元素:
>>> s = set(['A', 'B', 'C'])
可以查看 set 的內(nèi)容:
>>> print s
set(['A', 'C', 'B'])
請(qǐng)注意葫盼,上述打印的形式類似 list残腌, 但它不是 list,仔細(xì)看還可以發(fā)現(xiàn),打印的順序和原始 list 的順序有可能是不同的抛猫,因?yàn)閟et內(nèi)部存儲(chǔ)的元素是無(wú)序的蟆盹。
因?yàn)閟et不能包含重復(fù)的元素,所以闺金,當(dāng)我們傳入包含重復(fù)元素的 list 會(huì)怎么樣呢逾滥?
>>> s = set(['A', 'B', 'C', 'C'])
>>> print s
set(['A', 'C', 'B'])
>>> len(s)
3
結(jié)果顯示,set會(huì)自動(dòng)去掉重復(fù)的元素败匹,原來(lái)的list有4個(gè)元素寨昙,但set只有3個(gè)元素。
任務(wù):
請(qǐng)用set表示班里的4位同學(xué):
Adam, Lisa, Bart, Paul
代碼如下:
訪問(wèn)set
由于set存儲(chǔ)的是無(wú)序集合掀亩,所以我們沒(méi)法通過(guò)索引來(lái)訪問(wèn)舔哪。
訪問(wèn) set中的某個(gè)元素實(shí)際上就是判斷一個(gè)元素是否在set中。
例如槽棍,存儲(chǔ)了班里同學(xué)名字的set:
>>> s = set(['Adam', 'Lisa', 'Bart', 'Paul'])
我們可以用 in 操作符判斷:
Bart是該班的同學(xué)嗎尸红?
>>> 'Bart' in s
True
Bill是該班的同學(xué)嗎?
>>> 'Bill' in s
False
bart是該班的同學(xué)嗎刹泄?
>>> 'bart' in s
False
看來(lái)大小寫很重要外里,'Bart' 和 'bart'被認(rèn)為是兩個(gè)不同的元素。
任務(wù):
由于上述set不能識(shí)別小寫的名字特石,請(qǐng)改進(jìn)set盅蝗,使得 'adam' 和 'bart'都能返回True。
擴(kuò)展:
lower()方法語(yǔ)法:
str.lower()? #返回將字符串中所有大寫字符轉(zhuǎn)換為小寫后生成的字符串姆蘸。
upper()方法語(yǔ)法:
str.upper()? #返回小寫字母轉(zhuǎn)為大寫字母的字符串.
set的特點(diǎn)
set的內(nèi)部結(jié)構(gòu)和dict很像墩莫,唯一區(qū)別是不存儲(chǔ)value,因此逞敷,判斷一個(gè)元素是否在set中速度很快狂秦。
set存儲(chǔ)的元素和dict的key類似,必須是不變對(duì)象推捐,因此裂问,任何可變對(duì)象是不能放入set中的。
最后牛柒,set存儲(chǔ)的元素也是沒(méi)有順序的堪簿。
set的這些特點(diǎn),可以應(yīng)用在哪些地方呢皮壁?
星期一到星期日可以用字符串'MON', 'TUE', ... 'SUN'表示椭更。
假設(shè)我們讓用戶輸入星期一至星期日的某天,如何判斷用戶的輸入是否是一個(gè)有效的星期呢蛾魄?
可以用if 語(yǔ)句判斷虑瀑,但這樣做非常繁瑣:
x = '???'# 用戶輸入的字符串
if x!= 'MON' and x!= 'TUE' and x!= 'WED' ... and x!= 'SUN':
? ? print 'input error'
else:
? ? print 'input ok'
注意:if 語(yǔ)句中的...表示沒(méi)有列出的其它星期名稱湿滓,測(cè)試時(shí),請(qǐng)輸入完整舌狗。
如果事先創(chuàng)建好一個(gè)set叽奥,包含'MON' ~ 'SUN':
weekdays = set(['MON', 'TUE', 'WED', 'THU', 'FRI', 'SAT', 'SUN'])
再判斷輸入是否有效,只需要判斷該字符串是否在set中:
x = '???'# 用戶輸入的字符串
if x in weekdays:
? ? print 'input ok'
else:
? ? print 'input error'
這樣一來(lái)把夸,代碼就簡(jiǎn)單多了。
任務(wù):
月份也可以用set表示铭污,請(qǐng)?jiān)O(shè)計(jì)一個(gè)set并判斷用戶輸入的月份是否有效恋日。
月份可以用字符串'Jan', 'Feb', ...表示。
代碼如下:
遍歷set
由于 set 也是一個(gè)集合嘹狞,所以岂膳,遍歷 set 和遍歷 list 類似,都可以通過(guò) for 循環(huán)實(shí)現(xiàn)磅网。
直接使用 for 循環(huán)可以遍歷 set 的元素:
>>> s = set(['Adam', 'Lisa', 'Bart'])>>>fornameins:...? ? print name... LisaAdamBart
注意:觀察 for 循環(huán)在遍歷set時(shí)谈截,元素的順序和list的順序很可能是不同的,而且不同的機(jī)器上運(yùn)行的結(jié)果也可能不同涧偷。
任務(wù):
請(qǐng)用 for 循環(huán)遍歷如下的set簸喂,打印出name: score來(lái)。
s = set([('Adam', 95), ('Lisa', 85), ('Bart', 59)])
代碼如下:
更新set
由于set存儲(chǔ)的是一組不重復(fù)的無(wú)序元素燎潮,因此喻鳄,更新set主要做兩件事:
一是把新的元素添加到set中,二是把已有元素從set中刪除确封。
添加元素時(shí)除呵,用set的add()方法:
>>> s = set([1, 2, 3])
>>> s.add(4)
>>> print s
set([1, 2, 3, 4])
如果添加的元素已經(jīng)存在于set中,add()不會(huì)報(bào)錯(cuò)爪喘,但是不會(huì)加進(jìn)去了:
>>> s = set([1, 2, 3])
>>> s.add(3)
>>> print s
set([1, 2, 3])
刪除set中的元素時(shí)颜曾,用set的remove()方法:
>>> s = set([1, 2, 3, 4])
>>> s.remove(4)
>>> print s
set([1, 2, 3])
如果刪除的元素不存在set中,remove()會(huì)報(bào)錯(cuò):
>>> s = set([1, 2, 3])
>>> s.remove(4)
Traceback (most recent call last):
File "", line 1, in
KeyError: 4
所以用add()可以直接添加秉剑,而remove()前需要判斷泛豪。
任務(wù):
針對(duì)下面的set,給定一個(gè)list侦鹏,對(duì)list中的每一個(gè)元素候址,如果在set中,就將其刪除种柑,如果不在set中岗仑,就添加進(jìn)去。
s = set(['Adam', 'Paul'])
L = ['Adam', 'Lisa', 'Bart', 'Paul']
代碼如下: