本節(jié)要介紹的是Python里面常用的幾種數(shù)據(jù)結構丸升。通常情況下铆农,聲明一個變量只保存一個值是遠遠不夠的,我們需要將一組或多組數(shù)據(jù)進行存儲狡耻、查詢墩剖、排序等操作,本節(jié)介紹的Python內置的數(shù)據(jù)結構可以滿足大多數(shù)情況下的需求酝豪。這一部分的知識點比較多涛碑,而且較為零散,需要認真學習孵淘。
2.3.1字符串
字符串是Python中最常用的數(shù)據(jù)類型蒲障。我們可以使用引號('或")來創(chuàng)建字符串。
創(chuàng)建字符串很簡單瘫证,只要為變量分配一個值即可揉阎。例如:
var1='Hello World!'
var2="Python Runoob"
Python訪問字符串中的值
Python不支持單字符類型,單字符也在Python也是作為一個字符串使用背捌。
Python訪問子字符串毙籽,可以使用方括號來截取字符串,如下實例:
var1='Hello World!'
var2="Python Runoob"
print"var1[0]: ",var1[0]
print"var2[1:5]: ",var2[1:5]
以上實例執(zhí)行結果:
圖2
Python字符串更新
你可以對已存在的字符串進行修改毡庆,并賦值給另一個變量坑赡,如下實例:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
var1='Hello World!'
print"更新字符串:- ",var1[:6]+'Runoob!'
運行結果如下:
圖3
Python轉義字符
在需要在字符中使用特殊字符時,python用反斜杠(\)轉義字符么抗。如下表:
轉義字符
描述
\(在行尾時)
續(xù)行符
\\
反斜杠符號
\'
單引號
\"
雙引號
\a
響鈴
\b
退格(Backspace)
\e
轉義
\000
空
\n
換行
\v
縱向制表符
\t
橫向制表符
\r
回車
\f
換頁
\oyy
八進制數(shù)毅否,yy代表的字符,例如:\o12代表換行
\xyy
十六進制數(shù)蝇刀,yy代表的字符螟加,例如:\x0a代表換行
\other
其它的字符以普通格式輸出
Python字符串運算符
下表實例變量a值為字符串"Hello",b變量值為"Python":
操作符
描述
實例
+
字符串連接
a + b輸出結果:HelloPython
*
重復輸出字符串
a*2輸出結果:HelloHello
[]
通過索引獲取字符串中字符
a[1]輸出結果e
[ : ]
截取字符串中的一部分
a[1:4]輸出結果ell
in
成員運算符-如果字符串中包含給定的字符返回True
H in a輸出結果1
not in
成員運算符-如果字符串中不包含給定的字符返回True
M not in a輸出結果1
r/R
原始字符串-原始字符串:所有的字符串都是直接按照字面的意思來使用,沒有轉義特殊或不能打印的字符捆探。原始字符串除在字符串的第一個引號前加上字母"r"(可以大小寫)以外然爆,與普通字符串有著幾乎完全相同的語法。
print r'\n'輸出\n和print R'\n'輸出\n
%
格式字符串
請看下一章節(jié)
實例如下:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
a="Hello"
b="Python"
print"a + b輸出結果:",a+b
print"a * 2輸出結果:",a*2
print"a[1]輸出結果:",a[1]
print"a[1:4]輸出結果:",a[1:4]
if("H"ina):
print"H在變量a中"
else:
print"H不在變量a中"
if("M"notina):
print"M不在變量a中"
else:
print"M在變量a中"
printr'\n'
printR'\n'
以上程序執(zhí)行結果為:
圖4
Python字符串格式化
Python支持格式化字符串的輸出黍图。盡管這樣可能會用到非常復雜的表達式曾雕,但最基本的用法是將一個值插入到一個有字符串格式符%s的字符串中。
在Python中雌隅,字符串格式化使用與C中sprintf函數(shù)一樣的語法翻默。
比如下面的代碼:
#!/usr/bin/python
print"My name is %s and weight is %d kg!"%('Zara',21)
運行結果為:
圖5
python字符串格式化符號一覽表:
符號
描述
%c
格式化字符及其ASCII碼
%s
格式化字符串
%d
格式化整數(shù)
%u
格式化無符號整型
%o
格式化無符號八進制數(shù)
%x
格式化無符號十六進制數(shù)
%X
格式化無符號十六進制數(shù)(大寫)
%f
格式化浮點數(shù)字缸沃,可指定小數(shù)點后的精度
%e
用科學計數(shù)法格式化浮點數(shù)
%E
作用同%e恰起,用科學計數(shù)法格式化浮點數(shù)
%g
%f和%e的簡寫
%G
%f和%E的簡寫
%p
用十六進制數(shù)格式化變量的地址
格式化操作符輔助指令:
符號
功能
*
定義寬度或者小數(shù)點精度
-
用做左對齊
+
在正數(shù)前面顯示加號( + )
在正數(shù)前面顯示空格
#
在八進制數(shù)前面顯示零('0'),在十六進制前面顯示'0x'或者'0X'(取決于用的是'x'還是'X')
0
顯示的數(shù)字前面填充'0'而不是默認的空格
%
'%%'輸出一個單一的'%'
(var)
映射變量(字典參數(shù))
m.n.
m是顯示的最小總寬度,n是小數(shù)點后的位數(shù)(如果可用的話)
Python三引號(triple quotes)
python中三引號可以將復雜的字符串進行復制趾牧,python三引號允許一個字符串跨多行检盼,字符串中可以包含換行符、制表符以及其他特殊字符翘单。
三引號的語法是一對連續(xù)的單引號或者雙引號(通常都是成對的用)吨枉。
例如:
#三引號
hi = '''hi
there'''
print hi
運行結果如下:
圖6
Unicode字符串
Python中定義一個Unicode字符串和定義一個普通字符串一樣簡單:
s2=u'Hello World !';
print s2引號前小寫的"u"表示這里創(chuàng)建的是一個Unicode字符串。如果你想加入一個特殊字符哄芜,可以使用Python的Unicode-Escape編碼貌亭。如下例所示:
s3=u'Hello\u0020World !'
print s3
python的字符串內建函數(shù)
字符串方法是從python1.6到2.0慢慢加進來的——它們也被加到了Jython中。
這些方法實現(xiàn)了string模塊的大部分方法认臊,如下表所示列出了目前字符串內建支持的方法圃庭,所有的方法都包含了對Unicode的支持,有一些甚至是專門用于Unicode的失晴。
方法
描述
把字符串的第一個字符大寫
返回一個原字符串居中,并使用空格填充至長度width的新字符串
string.count(str, beg=0, end=len(string))
返回str在string里面出現(xiàn)的次數(shù)剧腻,如果beg或者end指定則返回指定范圍內str出現(xiàn)的次數(shù)
string.decode(encoding='UTF-8', errors='strict')
以encoding指定的編碼格式解碼string,如果出錯默認報一個ValueError的異常涂屁,除非errors指定的是'ignore'或者'replace'
string.encode(encoding='UTF-8', errors='strict')
以encoding指定的編碼格式編碼string书在,如果出錯默認報一個ValueError的異常,除非errors指定的是'ignore'或者'replace'
string.endswith(obj, beg=0, end=len(string))
檢查字符串是否以obj結束拆又,如果beg或者end指定則檢查指定的范圍內是否以obj結束儒旬,如果是,返回True,否則返回False.
把字符串string中的tab符號轉為空格帖族,tab符號默認的空格數(shù)是8栈源。
string.find(str, beg=0, end=len(string))
檢測str是否包含在string中,如果beg和end指定范圍盟萨,則檢查是否包含在指定范圍內凉翻,如果是返回開始的索引值,否則返回-1
string.index(str, beg=0, end=len(string))
跟find()方法一樣捻激,只不過如果str不在string中會報一個異常.
如果string至少有一個字符并且所有字符都是字母或數(shù)字則返
回True,否則返回False
如果string至少有一個字符并且所有字符都是字母則返回True,
否則返回False
如果string只包含十進制數(shù)字則返回True否則返回False.
如果string只包含數(shù)字則返回True否則返回False.
如果string中包含至少一個區(qū)分大小寫的字符制轰,并且所有這些(區(qū)分大小寫的)字符都是小寫前计,則返回True,否則返回False
如果string中只包含數(shù)字字符垃杖,則返回True男杈,否則返回False
如果string中只包含空格,則返回True调俘,否則返回False.
如果string是標題化的(見title())則返回True伶棒,否則返回False
如果string中包含至少一個區(qū)分大小寫的字符,并且所有這些(區(qū)分大小寫的)字符都是大寫彩库,則返回True肤无,否則返回False
以string作為分隔符,將seq中所有的元素(的字符串表示)合并為一個新的字符串
返回一個原字符串左對齊,并使用空格填充至長度width的新字符串
轉換string中所有大寫字符為小寫.
截掉string左邊的空格
string.maketrans(intab, outtab])
maketrans()方法用于創(chuàng)建字符映射的轉換表骇钦,對于接受兩個參數(shù)的最簡單的調用方式宛渐,第一個參數(shù)是字符串,表示需要轉換的字符眯搭,第二個參數(shù)也是字符串表示轉換的目標窥翩。
返回字符串STR中最大的字母。
返回字符串STR中最小的字母鳞仙。
有點像find()和split()的結合體,從str出現(xiàn)的第一個位置起,把字符串string分成一個3元素的元組(string_pre_str,str,string_post_str),如果string中不包含str則string_pre_str == string.
string.replace(str1, str2,? num=string.count(str1))
把string中的str1替換成str2,如果num指定寇蚊,則替換不超過num次.
string.rfind(str, beg=0,end=len(string) )
類似于find()函數(shù),不過是從右邊開始查找.
string.rindex( str, beg=0,end=len(string))
類似于index()棍好,不過是從右邊開始.
返回一個原字符串右對齊,并使用空格填充至長度width的新字符串
string.rpartition(str)
類似于partition()函數(shù),不過是從右邊開始查找.
刪除string字符串末尾的空格.
string.split(str="", num=string.count(str))
以str為分隔符切片string仗岸,如果num有指定值,則僅分隔num個子字符串
string.splitlines(num=string.count('\n'))
按照行分隔梳玫,返回一個包含各行作為元素的列表爹梁,如果num指定則僅切片num個行.
string.startswith(obj, beg=0,end=len(string))
檢查字符串是否是以obj開頭,是則返回True提澎,否則返回False姚垃。如果beg和end指定值,則在指定范圍內檢查.
在string上執(zhí)行l(wèi)strip()和rstrip()
翻轉string中的大小寫
返回"標題化"的string,就是說所有單詞都是以大寫開始盼忌,其余字母均為小寫(見istitle())
根據(jù)str給出的表(包含256個字符)轉換string的字符,
要過濾掉的字符放到del參數(shù)中
轉換string中的小寫字母為大寫
返回長度為width的字符串积糯,原字符串string右對齊,前面填充0
isdecimal()方法檢查字符串是否只包含十進制字符谦纱。這種方法只存在于unicode對象看成。
2.3.2列表
序列是Python中最基本的數(shù)據(jù)結構。序列中的每個元素都分配一個數(shù)字-它的位置跨嘉,或索引川慌,第一個索引是0,第二個索引是1,依此類推梦重。
Python有6個序列的內置類型兑燥,但最常見的是列表和元組。序列都可以進行的操作包括索引琴拧,切片降瞳,加,乘蚓胸,檢查成員子巾。此外淫奔,Python已經內置確定序列的長度以及確定最大和最小的元素的方法贱纠。列表是最常用的Python數(shù)據(jù)類型皆看,它可以作為一個方括號內的逗號分隔值出現(xiàn)偏陪。列表的數(shù)據(jù)項不需要具有相同的類型
創(chuàng)建一個列表策菜,只要把逗號分隔的不同的數(shù)據(jù)項使用方括號括起來即可劣光。如下所示:
list1=['physics','chemistry',1997,2000];
list2=[1,2,3,4,5];
list3=["a","b","c","d"];
與字符串的索引一樣亭引,列表索引從0開始贞岭。列表可以進行截取八毯、組合等。
訪問列表中的值
使用下標索引來訪問列表中的值瞄桨,同樣你也可以使用方括號的形式截取字符话速,如下所示:
#!/usr/bin/python
list1=['physics','chemistry',1997,2000];
list2=[1,2,3,4,5,6,7];
print"list1[0]: ",list1[0]
print"list2[1:5]: ",list2[1:5]
運行結果如下:
圖7
更新列表
你可以對列表的數(shù)據(jù)項進行修改或更新,你也可以使用append()方法來添加列表項芯侥,如下所示:
#!/usr/bin/python
list=['physics','chemistry',1997,2000];
print"Value available at index 2 : "
printlist[2];
list[2]=2001;
print"New value available at index 2 : "
printlist[2];
運行結果如下:
圖8
刪除列表元素
可以使用del語句來刪除列表的的元素泊交,如下所示:
#!/usr/bin/python
list1=['physics','chemistry',1997,2000];
printlist1;
dellist1[2];
print"After deleting value at index 2 : "
printlist1;
運行結果如下:
圖9
Python列表腳本操作符
列表對+和*的操作符與字符串相似。+號用于組合列表柱查,*號用于重復列表廓俭。
如下所示:
Python表達式
結果
描述
len([1, 2, 3])
3
長度
[1, 2, 3] + [4, 5, 6]
[1, 2, 3, 4, 5, 6]
組合
['Hi!'] * 4
['Hi!', 'Hi!', 'Hi!', 'Hi!']
重復
3 in [1, 2, 3]
True
元素是否存在于列表中
for x in [1, 2, 3]: print x,
1 2 3
迭代
Python列表截取
Python的列表截取與字符串操作類型,如下所示:
L=['spam','Spam','SPAM!']
操作:
Python表達式
結果
描述
L[2]
'SPAM!'
讀取列表中第三個元素
L[-2]
'Spam'
讀取列表中倒數(shù)第二個元素
L[1:]
['Spam', 'SPAM!']
從第二個元素開始截取列表
Python列表函數(shù)&方法
Python包含以下函數(shù):
序號
函數(shù)
1
比較兩個列表的元素
2
列表元素個數(shù)
3
返回列表元素最大值
4
返回列表元素最小值
5
將元組轉換為列表
Python包含以下方法:
序號
方法
1
在列表末尾添加新的對象
2
統(tǒng)計某個元素在列表中出現(xiàn)的次數(shù)
3
在列表末尾一次性追加另一個序列中的多個值(用新列表擴展原來的列表)
4
從列表中找出某個值第一個匹配項的索引位置
5
將對象插入列表
6
移除列表中的一個元素(默認最后一個元素)唉工,并且返回該元素的值
7
移除列表中某個值的第一個匹配項
8
反向列表中元素
9
對原列表進行排序
2.3.4元組
Python的元組與列表類似研乒,不同之處在于元組的元素不能修改。
元組使用小括號淋硝,列表使用方括號雹熬。
元組創(chuàng)建很簡單,只需要在括號中添加元素谣膳,并使用逗號隔開即可竿报。
如下代碼:
tup1 = ('physics', 'chemistry', 1997, 2000);
tup2 = (1, 2, 3, 4, 5 );
tup3 = "a", "b", "c", "d";
創(chuàng)建空元組
tup1 = ();
元組中只包含一個元素時,需要在元素后面添加逗號
tup1 = (50,);
元組與字符串類似继谚,下標索引從0開始烈菌,可以進行截取,組合等。
訪問元組
元組可以使用下標索引來訪問元組中的值芽世,如下實例:
#!/usr/bin/python
tup1 = ('physics', 'chemistry', 1997, 2000);
tup2 = (1, 2, 3, 4, 5, 6, 7 );
print "tup1[0]: ", tup1[0]
print "tup2[1:5]: ", tup2[1:5]
運行結果如下:
圖10
修改元組
元組中的元素值是不允許修改的侨嘀,但我們可以對元組進行連接組合,如下實例:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
tup1 = (12, 34.56);
tup2 = ('abc', 'xyz');
#以下修改元組元素操作是非法的捂襟。
# tup1[0] = 100;
#創(chuàng)建一個新的元組
tup3 = tup1 + tup2;
print tup3;
運行結果如下:
圖11
刪除元組
元組中的元素值是不允許刪除的咬腕,但我們可以使用del語句來刪除整個元組,如下實例:
#!/usr/bin/python
tup = ('physics', 'chemistry', 1997, 2000);
print tup;
del tup;
print "After deleting tup : "
print tup;
以上實例元組被刪除后葬荷,運行結果如下:
圖12
元組運算符
與字符串一樣涨共,元組之間可以使用+號和*號進行運算。這就意味著他們可以組合和復制宠漩,運算后會生成一個新的元組举反。
Python表達式
結果
描述
len((1, 2, 3))
3
計算元素個數(shù)
(1, 2, 3) + (4, 5, 6)
(1, 2, 3, 4, 5, 6)
連接
['Hi!'] * 4
['Hi!', 'Hi!', 'Hi!', 'Hi!']
復制
3 in (1, 2, 3)
True
元素是否存在
for x in (1, 2, 3): print x,
1 2 3
迭代
元組索引,截取
因為元組也是一個序列扒吁,所以我們可以訪問元組中的指定位置的元素火鼻,也可以截取索引中的一段元素,如下所示:
元組:
L = ('spam', 'Spam', 'SPAM!')
Python表達式
結果
描述
L[2]
'SPAM!'
讀取第三個元素
L[-2]
'Spam'
反向讀鹊癖馈魁索;讀取倒數(shù)第二個元素
L[1:]
('Spam', 'SPAM!')
截取元素
無關閉分隔符
任意無符號的對象,以逗號隔開盼铁,默認為元組粗蔚,如下實例:
#!/usr/bin/python
print 'abc', -4.24e93, 18+6.6j, 'xyz';
x, y = 1, 2;
print "Value of x , y : ", x,y;
運行結果如下:
圖13
元組內置函數(shù)
Python元組包含了以下內置函數(shù):
序號
方法及描述
1
比較兩個元組元素。
2
計算元組元素個數(shù)饶火。
3
返回元組中元素最大值鹏控。
4
返回元組中元素最小值。
5
將列表轉換為元組肤寝。
2.3.5字典
字典是另一種可變容器模型当辐,且可存儲任意類型對象。
字典的每個鍵值(key=>value)對用冒號(:)分割鲤看,每個對之間用逗號(,)分割缘揪,整個字典包括在花括號({})中,格式如下所示:
d={key1:value1,key2:value2}
鍵必須是唯一的,但值則不必刨摩。
值可以取任何數(shù)據(jù)類型寺晌,但鍵必須是不可變的,如字符串澡刹,數(shù)字或元組呻征。
一個簡單的字典實例:
dict={'Alice':'2341','Beth':'9102','Cecil':'3258'}
也可如此創(chuàng)建字典:
dict1={'abc':456};
dict2={'abc':123,98.6:37};
訪問字典里的值
把相應的鍵放入熟悉的方括弧,如下實例:
#!/usr/bin/python
dict={'Name':'Zara','Age':7,'Class':'First'};
print"dict['Name']: ",dict['Name'];
print"dict['Age']: ",dict['Age'];
運行結果如下:
圖14
如果用字典里沒有的鍵訪問數(shù)據(jù)罢浇,會輸出錯誤:
dict = {'Name': 'Zara', 'Age': 7, 'Class': 'First'};
print "dict['Name']: ", dict['Name'];
print "dict['Age']: ", dict['Age'];
print dict['Xuanhun']
運行結果如下:
圖15
修改字典
向字典添加新內容的方法是增加新的鍵/值對陆赋,修改或刪除已有鍵/值對如下實例:
#!/usr/bin/python
dict={'Name':'Zara','Age':7,'Class':'First'};
dict['Age']=8;# update existing entry
dict['School']="DPS School";# Add new entry
print"dict['Age']: ",dict['Age'];
print"dict['School']: ",dict['School'];
運行結果如下:
圖16
刪除字典元素
能刪單一的元素也能清空字典沐祷,清空只需一項操作。
顯示刪除一個字典用del命令攒岛,如下實例:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
dict={'Name':'Zara','Age':7,'Class':'First'};
deldict['Name'];#刪除鍵是'Name'的條目
dict.clear();#清空詞典所有條目
deldict;#刪除詞典
print"dict['Age']: ",dict['Age'];
print"dict['School']: ",dict['School'];
但這會引發(fā)一個異常赖临,因為用del后字典不再存在:
圖17
字典鍵的特性
字典值可以沒有限制地取任何python對象,既可以是標準的對象灾锯,也可以是用戶定義的兢榨,但鍵不行。
兩個重要的點需要記姿骋:
1)不允許同一個鍵出現(xiàn)兩次吵聪。創(chuàng)建時如果同一個鍵被賦值兩次,后一個值會被記住兼雄,如下實例:
#!/usr/bin/python
dict={'Name':'Zara','Age':7,'Name':'Manni'};
print"dict['Name']: ",dict['Name'];
以上實例輸出結果:
dict['Name']:Manni
2)鍵必須不可變吟逝,所以可以用數(shù)字,字符串或元組充當赦肋,所以用列表就不行块攒,如下實例:
#!/usr/bin/python
dict={['Name']:'Zara','Age':7};
print"dict['Name']: ",dict['Name'];
運行結果如下:
圖18
字典內置函數(shù)&方法
Python字典包含了以下內置函數(shù):
序號
函數(shù)及描述
1
比較兩個字典元素。
2
計算字典元素個數(shù)佃乘,即鍵的總數(shù)囱井。
3
輸出字典可打印的字符串表示。
4
返回輸入的變量類型恕稠,如果變量是字典就返回字典類型琅绅。
Python字典包含了以下內置方法:
序號
函數(shù)及描述
1
刪除字典內所有元素
2
返回一個字典的淺復制
3
創(chuàng)建一個新字典,以序列seq中元素做字典的鍵鹅巍,val為字典所有鍵對應的初始值
4
radiansdict.get(key, default=None)
返回指定鍵的值,如果值不在字典中返回default值
5
如果鍵在字典dict里返回true料祠,否則返回false
6
以列表返回可遍歷的(鍵,值)元組數(shù)組
7
以列表返回一個字典所有的鍵
8
radiansdict.setdefault(key, default=None)
和get()類似,但如果鍵不存在于字典中骆捧,將會添加鍵并將值設為default
9
把字典dict2的鍵/值對更新到dict里
10
以列表返回字典中的所有值
2.3.6集合
把不同元素放在一起就組成了集合,集合的成員被稱為集合元素髓绽。Python的集合和數(shù)學的結合在概念和操作上基本相同敛苇。Python提供了兩種集合:可變集合和不可變集合。
創(chuàng)建集合
我們先看下面創(chuàng)建集合的代碼顺呕。
#!/usr/bin/python
# -*- coding: UTF-8 -*-
s1=set('abcdde')
s2=set([1,2,3,4,5])
s3 = frozenset("xuanhun")
print type(s1)
print type(s3)
print s2
運行結果如下:
圖19
訪問集合
由于集合本身是無序的枫攀,所以不能為集合創(chuàng)建索引或切片操作,只能循環(huán)遍歷或使用in株茶、not in來訪問或判斷集合元素来涨。
接上面的代碼,添加一個循環(huán)輸出集合內容的代碼启盛,如下所示蹦掐。
圖20
從上圖的結果技羔,我們可以看到集合無序,無重復元素的特性卧抗。
更新集合
可使用以下內建方法來更新(只有可變集合才能被更新):
s.add()
s.update()
s.remove()
下面的代碼測試了集合的添加和刪除操作:
s2=set([1,2,3,4,5])
print s2
s2.add("j")
s2.remove(3)
print s2
運行結果如下:
圖21
聯(lián)合(|)
聯(lián)合(union)操作與集合的OR操作其實等價的藤滥,聯(lián)合符號有個等價的方法,union()社裆。
測試代碼如下:
s1=set('abcdde')
s2=set([1,2,3,4,5])
s4=s1|s2
print s4
運行結果如下:
圖22
交集(&)
與集合AND等價拙绊,交集符號的等價方法是intersection()。
>>> s1&s2
set(['n'])
>>> s1.intersection(s2)
set(['n'])
差集
等價方法是difference()泳秀。
>>> s1-s2
set(['i','b','e','g'])
>>> s1.difference(s2)
set(['i','b','e','g'])
2.3.7小結
基本類型和和基本數(shù)據(jù)結構我們都介紹完畢了时呀,是時候寫點更“復雜”的代碼了,下一節(jié)給大家介紹基本的條件判斷和循環(huán)晶默。