1.什么是字符串
序列筒扒,有序倚评,不可變的。
用單引號或者雙引號括起來的任意字符集媒楼。
2.字符串中的字符
a.普通字符: '23','ashNHJ','-=+!$@% #^&><?', '上的驚世毒妃', '??????'
b.轉(zhuǎn)義字符:\n, \t, ', ", \
阻止轉(zhuǎn)義:r/R
1.字符編碼
python中的字符采用的是Unicode編碼
a.什么是編碼
就是數(shù)字和字符的一一對應(yīng)的戚丸,其中字符對應(yīng)數(shù)字就是字符的編碼
a - 97
b - 98
余 - 20313
b.編碼方式
ASCII碼表:針對數(shù)字字符匣砖、字母字符、一些英文中常用的符號進(jìn)行編碼
采用一個字節(jié)對字符進(jìn)行編碼(128個字符)
Unicode碼:Unicode碼包含了ASCII碼表昏滴,同時能夠?qū)κ澜缟纤姓Z言對應(yīng)符號進(jìn)行編碼
采用兩個字節(jié)對字符進(jìn)行編碼,能編碼65536個字符
中文:4E00 ~ 9FA5
c.兩個函數(shù)
chr(編碼值) - 將字符編碼轉(zhuǎn)換成字符
ord(字符) - 獲取字符對應(yīng)的編碼值
print(chr(0x4E01))
yu = ord('余')
ting = ord('婷')
print(hex(yu), hex(ting))
d.可以將字符編碼放到字符串中便是一個字符: \u + 4位的16進(jìn)制編碼值
str1 = 'abc\u4f59123\u1234'
print(str1)
獲取字符串中的字符
一旦一個字符串確定猴鲫,那么字符串中每個字符的位置就確定。
而且每個字符會對應(yīng)一個用來表示其位置和順序的下標(biāo)值谣殊。
1.下標(biāo)(索引)
字符串中的每個字符都有一個下標(biāo)拂共,代表其在字符串中的位置
下標(biāo)的范圍是: 0 ~ 字符串長度-1 (0代表第一個字符的位置)
-1 ~ -字符串長度 (-1代表最后一個字符的位置)
'abc' # 'a': 0/-3 'b':1/-2 'c':2/-1
'abc\n123' # '1': 4/-3
'abc\u4eff1234' # '1': 4/-3
2.獲取單個字符
語法:字符串[下標(biāo)] - 獲取字符串中,指定下標(biāo)對應(yīng)的字符
說明: 字符串 - 可以是字符串常量姻几,也可以是字符串變量(只要結(jié)果是字符串就行)
[] - 固定寫法
下標(biāo) - 字符的下標(biāo)宜狐,不能越界
str1 = 'hello python'
print(str1[6], str1[-6])
print(str1[-2])
print(str1[12]) # IndexError: string index out of range
print(str1[-20]) # IndexError: string index out of range
3.獲取部分字符
方法1:
a.語法:字符串[開始下標(biāo):結(jié)束下標(biāo):步長]
b.說明:字符串 - 可以是字符串常量,也可以是字符串變量(只要結(jié)果是字符串就行)
[] - 固定寫法
: - 固定寫法
開始下標(biāo)蛇捌、結(jié)束下標(biāo) - 下標(biāo)值
步長 - 整數(shù)
c.功能:
從開始下標(biāo)開始獲取到結(jié)束下標(biāo)前為止, 每次下標(biāo)值增加步長對應(yīng)的值抚恒。結(jié)果是字符串
d.注意:
當(dāng)步長是正數(shù)(從前往后取), 開始下標(biāo)對應(yīng)的字符要在結(jié)束下標(biāo)對應(yīng)的字符的前面
當(dāng)步長是負(fù)數(shù)(從后往前取),開始下標(biāo)對應(yīng)的字符要在結(jié)束下標(biāo)對應(yīng)的字符的后面
結(jié)束下標(biāo)對應(yīng)的值取不到的
str1 = 'abcdefghij'
print(str1[0:6:1])
abcdef
print(str1[0:6:2])
ace
print('==:',str1[-1:6:-1])
print(str1[-1:2:-2])
方法2:
語法:字符串[開始下標(biāo):結(jié)束下標(biāo)] (相當(dāng)于步長是1)
str1 = 'abc123abc'
print(str1[-1:3]) # '' - 空串
print(str1[3:-1])
4.獲取部分字符络拌,省略下標(biāo)
獲取部分字符的時候俭驮,開始下標(biāo)和結(jié)束下標(biāo)都可以省略
a.開始下標(biāo)省略
字符串[:結(jié)束下標(biāo):步長] 或者 字符串[:結(jié)束下標(biāo)]
步長是正數(shù):從字符串開頭開始往后獲取
步長是負(fù)數(shù):從字符串結(jié)尾開始往前獲取
str1 = 'abc123abc'
print(str1[:4:1])
print(str1[:4:-1])
b.結(jié)束下標(biāo)省略
字符串[開始下標(biāo)::步長] 或者 字符串[結(jié)束下標(biāo):]
步長是正數(shù):從開始下標(biāo)從前往后獲取到字符串結(jié)束
步長是負(fù)數(shù):從開始下標(biāo)從前后往前獲取到字符串開頭
print(str1[4:])
print(str1[4::-1])
print(str1[:])
print(str1[::-1]) # 字符串倒序
print(str1[-100:100]) # 這兒的開始下標(biāo)和結(jié)束下標(biāo)都可以越界
注:方向判斷只看步數(shù)正負(fù),正(從左到右)春贸,省略步數(shù)默認(rèn)為1
字符串的相關(guān)運(yùn)算
字符串1 + 字符串2: 將兩個字符串拼接在一起產(chǎn)生一個新的字符串(不會修改原字符)
注意:字符串相加混萝,加號兩邊必須都是字符串
str1 = 'abc'
str2 = '123'
print(str1 + str2, str1, str2)
print(str2+10) # TypeError: must be str, not int
print(str2+'10') # 12310
2. *
字符串 * n(正整數(shù)):字符串的內(nèi)容重復(fù)n次,產(chǎn)生一個新的字符串
str1 = 'abc'
print(str1*3)
print(''10)
3.比較運(yùn)算符: >萍恕,<. ==, !=, >=, <=
a. ==, !=
字符串1 == 字符串2 - 判斷兩個字符串是否相等
print('abc' == 'abc')
print('abc' != 'abc')
print('abc' == 'cba')
a. >, <, >=, <=
兩個字符串比較大幸萼帧:從第一個開始,找到第一對不同的字符允粤,然后比較他們的編碼值的大小
print('abc' > 'ad') # False
print('abcdZ' > 'abcde' ) # False
print('1abc' < 'ahkks') # True
4. in 和 not in
字符串1 in 字符串2:判斷字符串2中是否包含字符串1崭倘,結(jié)果是布爾
字符串1 not in 字符串2:判斷字符串2中是否不包含字符串1翼岁,結(jié)果是布爾
print('abc' in 'abc123') # True
print('abc' in 'ab123c') # False
print('abc' not in 'ab123c') # True
print('#' in 'ahs#hf#23') # True
5.len函數(shù)
len(序列)
len(字符串) - 獲取字符串中字符的個數(shù)
print(len('abc123'))
print(len('abc\n123\u4edd')) # 8
print(len('abc\n123\u4edd')) # 13
print(len(r'abc\n123\u4edd')) # 14
print(len('abc\t1 23')) # 8
6.str
str(數(shù)據(jù));將數(shù)據(jù)轉(zhuǎn)換成字符串
a.其他數(shù)據(jù)轉(zhuǎn)換成字符串:
所有的類型的數(shù)據(jù)都可以轉(zhuǎn)換成字符串司光。轉(zhuǎn)換的時候就是在數(shù)據(jù)的值的最外面加引號
補(bǔ)充:系統(tǒng)數(shù)據(jù)類型名不能用來給變量命名
a.其他數(shù)據(jù)轉(zhuǎn)換成字符串:
所有的類型的數(shù)據(jù)都可以轉(zhuǎn)換成字符串琅坡。轉(zhuǎn)換的時候就是在數(shù)據(jù)的值的最外
面加引號
str1 = str(100)
print(str1, type(str1))
b.字符串轉(zhuǎn)其他類型
字符串轉(zhuǎn)整數(shù): int(字符串), 只有去掉引號后剩下的部分本身就是一個整數(shù)的字符串才能轉(zhuǎn)換成整型
字符串轉(zhuǎn)浮點(diǎn)型: float(字符串),只有去掉引號后剩下的部分本身就是一個整數(shù)或者小數(shù)的字符串才能轉(zhuǎn)換成浮點(diǎn)型
字符串轉(zhuǎn)布爾: bool(字符串), 除了空串會轉(zhuǎn)換成False,其他所有的字符串都會轉(zhuǎn)換成True
補(bǔ)充:系統(tǒng)數(shù)據(jù)類型名不能用來給變量命名
print(int('-123'))
print(float('12.89'), float('123'), float('2e3'))
print(bool('0'), bool('False')) # True
print(bool('')) # False
格式字符串
1.格式字符串
指的是字符串中通過格式占位符來表示字符串中變化,然后后面再通過其他的值來給占位符賦值
語法:
含有格式占位符的字符串 % (占位符對應(yīng)的值)
說明:格式占位符 - 有固定的寫法;可以有多個
% - 固定寫法
() - 里面的值的個數(shù)和值的類型要和前面的格式占位符一一對應(yīng)
2.常見格式占位符
%d - 整數(shù)
%s - 字符串
%.nf - 小數(shù)(保留小數(shù)點(diǎn)后n位小數(shù))
%c - 字符 (可以將數(shù)字轉(zhuǎn)換成字符)
name = input('名字:')
message = '%s你好飘庄,吃飯了嗎脑蠕?' % (name)
print(message)
message = '%s,今年%d歲购撼,體重:%.2fkg 血型是:%c' % (name, 18+2, 65, 97)
print(message)
message = name + ',今年'+ str(18+2)+'歲跪削,體重:'+ str(65)+'kg 血型是:'+chr(97)
print(message)