1.什么是字符串
序列,有序抗碰,不可變的集灌。
用單引號或者雙引號括起來的任意字符集。
2.字符串中的字符
a.普通字符: 如:'23'亭罪,'ashNHJ','-=+!$@% #^&><?', '上的驚世毒妃', '??????'
b.轉(zhuǎn)義字符:\n, \t, ', ", \
阻止轉(zhuǎn)義:r/R
3.字符編碼
python中的字符采用的是Unicode編碼
a.什么是編碼
就是數(shù)字和字符的一一對應(yīng)的瘦馍,其中字符對應(yīng)數(shù)字就是字符的編碼
如:
a - 97
b - 98
b.編碼方式
ASCII碼表:針對數(shù)字字符、字母字符应役、一些英文中常用的符號進(jìn)行編碼
采用一個(gè)字節(jié)對字符進(jìn)行編碼(128個(gè)字符)
Unicode碼:Unicode碼包含了ASCII碼表情组,同時(shí)能夠?qū)κ澜缟纤姓Z言對應(yīng)符號進(jìn)行編碼
采用兩個(gè)字節(jié)對字符進(jìn)行編碼,能編碼65536個(gè)字符
中文:4E00 ~ 9FA5
c.兩個(gè)函數(shù)
- chr(編碼值) - 將字符編碼轉(zhuǎn)換成字符
- ord(字符) - 獲取字符對應(yīng)的編碼值
print(chr(0x4E01))
yu = ord('余')
ting = ord('婷')
print(hex(yu), hex(ting))
結(jié)果如下
d.可以將字符編碼放到字符串中便是一個(gè)字符: \u + 4位的16進(jìn)制編碼值
str1 = 'abc\u4f59123\u1234'
print(str1)
結(jié)果如下
4.獲取字符串中的字符
- 一旦一個(gè)字符串確定,那么字符串中每個(gè)字符的位置就確定箩祥。
- 而且每個(gè)字符會對應(yīng)一個(gè)用來表示其位置和順序的下標(biāo)值院崇。
1.下標(biāo)(索引)
- 字符串中的每個(gè)字符都有一個(gè)下標(biāo),代表其在字符串中的位置
- 下標(biāo)的范圍是: 0 ~ 字符串長度-1 (0代表第一個(gè)字符的位置)
-1 ~ -字符串長度 (-1代表最后一個(gè)字符的位置)
'abc' # 'a': 0/-3 'b':1/-2 'c':2/-1
'abc\n123' # '1': 4/-3
'abc\u4eff1234' # '1': 4/-3
2.獲取單個(gè)字符
- 語法:字符串[下標(biāo)] - 獲取字符串中袍祖,指定下標(biāo)對應(yīng)的字符
- 說明: 字符串 - 可以是字符串常量底瓣,也可以是字符串變量(只要結(jié)果是字符串就行)
- [] - 固定寫法
- 下標(biāo) - 字符的下標(biāo),不能越界
str1 = 'hello python'
print(str1[6], str1[-6])
print(str1[-2])
# print(str1[12]) # IndexError: string index out of range
# print(str1[-20]) # IndexError: string index out of range
結(jié)果如下:
3.獲取部分字符
方法1:
a.語法:字符串[開始下標(biāo):結(jié)束下標(biāo):步長]
b.說明:字符串 - 可以是字符串常量蕉陋,也可以是字符串變量(只要結(jié)果是字符串就行)
- [] - 固定寫法
- : - 固定寫法
- 開始下標(biāo)捐凭、結(jié)束下標(biāo) - 下標(biāo)值
- 步長 - 整數(shù)
c.功能:
- 從開始下標(biāo)開始獲取到結(jié)束下標(biāo)前為止, 每次下標(biāo)值增加步長對應(yīng)的值。結(jié)果是字符串
d.注意:
當(dāng)步長是正數(shù)(從前往后取), 開始下標(biāo)對應(yīng)的字符要在結(jié)束下標(biāo)對應(yīng)的字符的前面
當(dāng)步長是負(fù)數(shù)(從后往前取)凳鬓,開始下標(biāo)對應(yīng)的字符要在結(jié)束下標(biāo)對應(yīng)的字符的后面
結(jié)束下標(biāo)對應(yīng)的值取不到的
str1 = 'abcdefghij'
print(str1[0:6:1])
# abcdef
print(str1[0:6:2])
# ace
print('==:',str1[-1:6:-1])
print(str1[-1:2:-2])
結(jié)果如下
方法2:
語法:字符串[開始下標(biāo):結(jié)束下標(biāo)] (相當(dāng)于步長是1)
str1 = 'abc123abc'
print(str1[-1:3]) # '' - 空串
print(str1[3:-1])
結(jié)果如下
4.獲取部分字符茁肠,省略下標(biāo)
- 獲取部分字符的時(shí)候,開始下標(biāo)和結(jié)束下標(biāo)都可以省略
a.開始下標(biāo)省略
- 字符串[:結(jié)束下標(biāo):步長] 或者 字符串[:結(jié)束下標(biāo)]
- 步長是正數(shù):從字符串開頭開始往后獲取
- 步長是負(fù)數(shù):從字符串結(jié)尾開始往前獲取
str1 = 'abc123abc'
print(str1[:4:1])
print(str1[:4:-1])
結(jié)果如下
b.結(jié)束下標(biāo)省略
- 字符串[開始下標(biāo)::步長] 或者 字符串[結(jié)束下標(biāo):]
- 步長是正數(shù):從開始下標(biāo)從前往后獲取到字符串結(jié)束
- 步長是負(fù)數(shù):從開始下標(biāo)從前后往前獲取到字符串開頭
print(str1[4:])
print(str1[4::-1])
print(str1[:])
print(str1[::-1]) # 字符串倒序
print(str1[-100:100]) # 這兒的開始下標(biāo)和結(jié)束下標(biāo)都可以越界
結(jié)果如下
5.字符串相關(guān)運(yùn)算
1. +
-
字符串1 + 字符串2: 將兩個(gè)字符串拼接在一起產(chǎn)生一個(gè)新的字符串(不會修改原字符)
注意:字符串相加缩举,加號兩邊必須都是字符串
str1 = 'abc'
str2 = '123'
print(str1 + str2, str1, str2)
# print(str2+10) # TypeError: must be str, not int
print(str2+'10') # 12310
結(jié)果如下
2. *
- 字符串 * n(正整數(shù)):字符串的內(nèi)容重復(fù)n次官套,產(chǎn)生一個(gè)新的字符串
str1 = 'abc'
print(str1*3)
print('*'*10)
# 練習(xí): 10個(gè)*跟10個(gè)% ***..%%%..
print(('*'*10+'%'*10)*3) #**********%%%%%%%%%%**********%%%%%%%%%%**********%%%%%%%%%%
結(jié)果如下
3.比較運(yùn)算符: >,<. ==, !=, >=, <=
a. ==, !=
- 字符串1 == 字符串2 - 判斷兩個(gè)字符串是否相等
print('abc' == 'abc') #True
print('abc' != 'abc') #False
print('abc' == 'cba') #False
b.. >, <, >=, <=
- 兩個(gè)字符串比較大幸峡住:從第一個(gè)開始奶赔,找到第一對不同的字符,然后比較他們的編碼值的大小
print('abc' > 'ad') # False
print('abcdZ' > 'abcde' ) # False
print('1abc' < 'ahkks') # True
# 練習(xí):判斷一個(gè)字符是否是字母
# char = input('請輸入一個(gè)字符:')
char = 'a'
print('是否是字母:', 'a' <= char <= 'z' or 'A' <= char <= 'Z')
# 練習(xí):判斷一個(gè)字符是否是中文
print('是否是中文:', '\u4e00' <= char <= '\u9fa5')
print('是否是中文:', 0x4e00 <= ord(char) <= 0x9fa5)
print('是否是中文:', '一' <= char <= '龥')
結(jié)果如下
4. in 和 not in
- 字符串1 in 字符串2:判斷字符串2中是否包含字符串1杠氢,結(jié)果是布爾
- 字符串1 not in 字符串2:判斷字符串2中是否不包含字符串1站刑,結(jié)果是布爾
print('abc' in 'abc123') # True
print('abc' in 'ab123c') # False
print('abc' not in 'ab123c') # True
print('#' in 'ahs#hf#23') # True
5.len函數(shù)
len(序列)
len(字符串) - 獲取字符串中字符的個(gè)數(shù)
print(len('abc123')) #6
print(len('abc\n123\u4edd')) # 8
print(len('abc\n123\\u4edd')) # 13
print(len(r'abc\n123\u4edd')) # 14
print(len('abc\t1 23')) # 8
6.str
- str(數(shù)據(jù));將數(shù)據(jù)轉(zhuǎn)換成字符串
a.其他數(shù)據(jù)轉(zhuǎn)換成字符串:
- 所有的類型的數(shù)據(jù)都可以轉(zhuǎn)換成字符串鼻百。轉(zhuǎn)換的時(shí)候就是在數(shù)據(jù)的值的最外面加引號
補(bǔ)充:系統(tǒng)數(shù)據(jù)類型名不能用來給變量命名
str1 = str(100)
print(str1, type(str1)) #100
b.字符串轉(zhuǎn)其他類型
- 字符串轉(zhuǎn)整數(shù): int(字符串), 只有去掉引號后剩下的部分本身就是一個(gè)整數(shù)的字符串才能轉(zhuǎn)換成整型
- 字符串轉(zhuǎn)浮點(diǎn)型: float(字符串),只有去掉引號后剩下的部分本身就是一個(gè)整數(shù)或者小數(shù)的字符串才能轉(zhuǎn)換成浮點(diǎn)型
- 字符串轉(zhuǎn)布爾: bool(字符串), 除了空串會轉(zhuǎn)換成False,其他所有的字符串都會轉(zhuǎn)換成True
print(int('-123')) #-123
print(float('12.89'), float('123'), float('2e3')) #12.89 123.0 2000.0
print(bool('0'), bool('False')) # True
print(bool('')) # False
6.格式字符串
1.格式字符串
指的是字符串中通過格式占位符來表示字符串中變化绞旅,然后后面再通過其他的值來給占位符賦值
語法:
含有格式占位符的字符串 % (占位符對應(yīng)的值)說明:格式占位符 - 有固定的寫法;可以有多個(gè)
% - 固定寫法
() - 里面的值的個(gè)數(shù)和值的類型要和前面的格式占位符一一對應(yīng)
2.常見格式占位符
%d - 整數(shù)
%s - 字符串
%.nf - 小數(shù)(保留小數(shù)點(diǎn)后n位小數(shù))
%c - 字符 (可以將數(shù)字轉(zhuǎn)換成字符)
name = input('名字:')
message = '%s你好,吃飯了嗎温艇?' % (name)
print(message)
message = '%s,今年%d歲因悲,體重:%.2fkg 血型是:%c' % (name, 18+2, 65, 97)
print(message)
message = name + ',今年'+ str(18+2)+'歲,體重:'+ str(65)+'kg 血型是:'+chr(97)
print(message)
結(jié)果如下
7.字符串常用方法
1.字符串.capitalize() - 將字符串第一個(gè)字符轉(zhuǎn)換成大寫
str1 = 'hello'
new_str = str1.capitalize()
print(new_str) # Hello
2.字符串對齊
字符串.center(width, fillchar) - 居中
字符串.ljust(width, fillchar) - 左對齊
字符串.rjust(width, fillchar) - 右對齊
width - 正整數(shù)勺爱,表示新的字符串的寬度
fillchar - 字符晃琳, 填充字符串
str1 = '123'
new_str = str1.center(7, '/')
print(new_str) # //123//
new_str = str1.ljust(7, '/')
print(new_str) # 123////
new_str = str1.rjust(7, '/')
print(new_str) # ////123
3. isalpha()
- 字符串.isalpha() - 如果字符串至少有一個(gè)字符并且所有字符都是字母則返回 True, 否則返回 False
str1 = '23434'
print(str1.isalpha()) #False
4. isdigit()
- 字符串.isdigit() - 如果字符串只包含數(shù)字則返回 True 否則返回 False.
str1 = '壹23萬萬43幺一百'
print(str1.isdigit()) #False
5.isnumeric()
- 字符串.isnumeric() - 如果字符串中只包含數(shù)字字符,則返回 True,否則返回 False(中文數(shù)字也可以)
print(str1.isnumeric()) #True
6.join(seq)
- 字符串1.join(字符串2): 將字符串1的內(nèi)容插入到字符串2的每個(gè)字符之間
str1 = '**'
str2 = 'abc'
print(str1.join(str2)) # a**b**c
7.max(字符串)和min(字符串)
print(max('ahajsxnzhsjdf234')) # z
print(min('ahajsxnzhsjdf234')) # 2
8.replace(old, new [, max])
- 將字符串中的 str1 替換成 str2,如果 max 指定卫旱,則替換不超過 max 次人灼。
print('agskshabkkhabba'.replace('a', '/')) # /gsksh/bkkh/bb/
9.split(str="", num=string.count(str))
- num=string.count(str)) 以 str 為分隔符截取字符串,如果 num 有指定值顾翼,則僅截取 num 個(gè)子字符串
print('agsk*shabkk*habba'.split('*')) # ['agsk', 'shabkk', 'habba']
10. count(str)
- 返回 str 在 string 里面出現(xiàn)的次數(shù)
str1 = "askjdbasa"
print(str1.count("a")) # 3
11.startswith(str, beg=0,end=len(string)),endswith(suffix)
- startswith(str, beg=0,end=len(string)):檢查字符串是否是以 obj 開頭投放,是則返回 True,否則返回 False适贸。如果beg 和 end 指定值灸芳,則在指定范圍內(nèi)檢查。
- endswith(suffix):檢查字符串是否以 obj 結(jié)束拜姿,如果beg 或者 end 指定則檢查指定的范圍內(nèi)是否以 obj 結(jié)束耗绿,如果是,返回 True,否則返回 False.
str1 = "askj dbasa"
print(str1.startswith("a")) # True
print(str1.startswith("c")) # False
12.expandtabs()
- 把字符串 string 中的 tab 符號轉(zhuǎn)為空格砾隅,tab 符號默認(rèn)的空格數(shù)是 8 误阻。
str1 = "askj dbasa"
print(str1.expandtabs()) # askj dbasa
13.find(str, beg=0 end=len(string)), index(str, beg=0, end=len(string))
- find(str, beg=0 end=len(string)):檢測 str 是否包含在字符串中,如果指定范圍 beg 和 end 晴埂,則檢查是否包含在指定范圍內(nèi)究反,如果包含返回開始的索引值,否則返回-1
str1 = "askj dbasa"
print(str1.find("k", 0,10)) # 2
print(str1.find("o", 0,10)) # -1
- index(str, beg=0, end=len(string)):檢測 str 是否包含在字符串中儒洛,如果指定范圍 beg 和 end 精耐,則檢查是否包含在指定范圍內(nèi),如果包含返回開始的索引值琅锻,否則會報(bào)一個(gè)異常
str1 = "askj dbasa"
print(str1.index("k", 0,10)) # 2
print(str1.index("o", 0,10)) # ValueError: substring not found
14.islower()
- 如果字符串中包含至少一個(gè)區(qū)分大小寫的字符卦停,并且所有這些(區(qū)分大小寫的)字符都是小寫,則返回 True恼蓬,否則返回 False
str1 = "askj dbasa"
print(str1.islower()) # True
str2 = "13241657"
print(str2.islower()) # False
15.isnumeric()
- 如果字符串中只包含數(shù)字字符惊完,則返回 True,否則返回 False(中文數(shù)字也可以)
str3 = '壹23萬萬43幺一百'
print(str3.isnumeric()) # True
str1 = "askj dbasa"
print(str3.isnumeric()) # False
16.isspace()
- 如果字符串中只包含空白处硬,則返回 True小槐,否則返回 False.
str1 = "askj dbasa"
str4 = " "
print(str1.isspace()) # False
print(str4.isspace()) # True
17.istitle()
- 如果字符串是標(biāo)題化的(見 title())則返回 True,否則返回 False
str1 = "askj dbasa"
str5 = "This Is String Example...Wow!!!"
print(str5.istitle()) # True
print(str1.istitle()) # False
18.isupper() , islower()
- isupper():如果字符串中包含至少一個(gè)區(qū)分大小寫的字符荷辕,并且所有這些(區(qū)分大小寫的)字符都是大寫凿跳,則返回 True,否則返回 False
str1 = "askj dbasa"
str6 = "ASDFASDFAS"
print(str6.isupper()) # True
print(str1.isupper()) # False
- islower():如果字符串中包含至少一個(gè)區(qū)分大小寫的字符疮方,并且所有這些(區(qū)分大小寫的)字符都是小寫控嗜,則返回 True,否則返回 False
str1 = "askj dbasa"
str6 = "ASDFASDFAS"
print(str6.islower()) # False
print(str1.islower()) # True
19.lstrip() 骡显, rstrip()
- .lstrip() :截掉字符串左邊的空格或指定字符疆栏。
str7 = " dsa12"
print(str7.lstrip()) #dsa12
str8 = "*dsa12"
print(str8.lstrip(*)) #dsa12
- rstrip():刪除字符串字符串末尾的空格
str9 = "*dsa12*"
print(str9.rstrip("*")) #*dsa12
str10 = "*dsa12 "
print(str10.rstrip("*")) #*dsa12
20.lower()曾掂,upper()
- lower():轉(zhuǎn)換字符串中所有大寫字符為小寫.
str6 = "ASDFASDFAS"
print(str6.lower()) # asdfasdfas
- upper():轉(zhuǎn)換字符串中的小寫字母為大寫
str1 = "askj dbasa"
print(str1.upper()) # ASKJ DBASA
21.title()
- 返回"標(biāo)題化"的字符串,就是說所有單詞都是以大寫開始,其余字母均為小寫(見 istitle())
str1 = "askj dbasa"
print(str1.title()) # Askj Dbasa
22.isdecimal()
- 檢查字符串是否只包含十進(jìn)制字符承边,如果是返回 true遭殉,否則返回 false石挂。
str1 = "askj dbasa"
print(str1.isdecimal()) # False
str2 = "13241657"
print(str2.isdecimal()) # True
23.字符串.zfill (width) - 返回長度為 width 的字符串博助,原字符串右對齊,前面填充0
str2 = "adsd Da ce Aeea"
print(str2.zfill(20)) # 00000adsd Da ce Aeea
24.swapcase()
- 將字符串中大寫轉(zhuǎn)換為小寫痹愚,小寫轉(zhuǎn)換為大寫
str5 = "This Is String Example...Wow!!!"
print(str5.swapcase()) # tHIS iS sTRING eXAMPLE...wOW!!!