認(rèn)識(shí)字符串
1.什么是字符串(str)
字符串屬于容器型數(shù)據(jù)類型,又叫序列;將引號(hào)(單雙引號(hào)均可)作為容器,字符是元素
不可變(字符個(gè)數(shù)献联、字符值和順序不可變)、有序(字符的順序不同,字符串的值就不一樣)
str1 = 'sf32'
print('Hello' == 'eHllo') # 字符串有序, False
print([1, 2, 3] == [3, 2, 1]) # 列表有序, False
print({1, 2, 3} == {3, 2, 1}) # 集合無(wú)序, True
2.字符串中的內(nèi)容
字符串中的每個(gè)基本單元就是字符;python中有字符的概念,但是沒(méi)有字符對(duì)應(yīng)的數(shù)據(jù)類型
1)普通字符: 例如,字母,數(shù)字,文字,符號(hào)
'dkff'
'234'
'方式'
'**(#$'
2)轉(zhuǎn)義字符: 在指定的符號(hào)前加反斜杠來(lái)表示一些具有特殊功能或者特殊意義的符號(hào)
\n - 換行
\t - 制表符
' - 一個(gè)單引號(hào)
" - 一個(gè)雙引號(hào)
\ - 一個(gè)反斜杠
str2 = '\t32d"wd\n\tw\'f"3'
str3 = '123\\nabc'
str4 = '335\rerw'
print(str2)
print(str3)
print(str4)
3)編碼字符串: \u四位十六進(jìn)制編碼值,表示一個(gè)編碼值對(duì)應(yīng)的字符
str5 = '\u4e80'
print(str5)
4)編碼: 計(jì)算機(jī)存儲(chǔ)字符的時(shí)候?qū)嵸|(zhì)存的是字符對(duì)應(yīng)的編碼值,每個(gè)字符的編碼值是固定的
計(jì)算機(jī)本身只有存儲(chǔ)數(shù)字的能力,而且存的是數(shù)字的補(bǔ)碼(二進(jìn)制)
字符和字符的編碼的一一對(duì)應(yīng)關(guān)系叫編碼表;常見(jiàn)的編碼表有: ASCII表和Unicode表,python的字符采用的是Unicode編碼
Unicode表是ASCii表的擴(kuò)充,包含了世界上所有的語(yǔ)言符號(hào)
中文編碼范圍: 0x4e00 - 0x9fa5
chr(編碼值) - 獲取編碼值對(duì)應(yīng)的字符
ord(字符) - 獲取字符的編碼值
num = 0
for code in range(0x4e00, 0x9fa6):
num += 1
if num % 30 == 0:
print()
print(chr(code), end='')
print(hex(ord('習(xí)')), hex(ord('蛤')))
5)阻止轉(zhuǎn)義: 在字符串的最前面加r/R可以組織當(dāng)前的字符串中的所有轉(zhuǎn)義字符轉(zhuǎn)義
注意: 一個(gè)轉(zhuǎn)義字符和一個(gè)編碼字符的長(zhǎng)度都是1
str6 = '\tabc\n123\u4e94'
print(str6)
str7 = r'\tabc\n123\u4e94'
print(str7)
字符串操作
1.獲取字符
1)獲取單個(gè)字符
a.語(yǔ)法
字符串[下標(biāo)] - 獲取指定下表=標(biāo)對(duì)應(yīng)的字符
b.說(shuō)明
字符串 - 可以是字符串值、字符串變量或者結(jié)果是字符串的表達(dá)式
[] - 固定寫法
下標(biāo)(index) - 下標(biāo)又叫索引;字符串一旦確定,那么字符串中的每個(gè)字符的位置就確定了,
每個(gè)字符都會(huì)對(duì)應(yīng)一個(gè)固定的下標(biāo)來(lái)表示字符在字符串中的位置
下標(biāo)的值有兩種:0 ~ 字符串長(zhǎng)度-1/-1 ~ -字符串長(zhǎng)度
下標(biāo)0對(duì)應(yīng)的是第一個(gè)字符,下標(biāo)-1對(duì)應(yīng)最后一個(gè)字符
print('abc123'[0])
str1 = '雞你太美'
print(str1[-4])
2)獲取部分字符(字符串切片)
a.語(yǔ)法
字符串[開(kāi)始下標(biāo):結(jié)束下標(biāo):步長(zhǎng)] - 從開(kāi)始下標(biāo)開(kāi)始獲取,每次增加步長(zhǎng)去取下一個(gè)字符,直到獲取結(jié)束下標(biāo)前位置
b.說(shuō)明
字符串 - 字符串值或者之字符串變量
[] - 固定寫法
開(kāi)始下標(biāo), 結(jié)束下標(biāo) - 下標(biāo)值
步長(zhǎng) - 整數(shù)
c.注意
結(jié)束下標(biāo)對(duì)應(yīng)的字符永遠(yuǎn)取不到
當(dāng)步長(zhǎng)為正,開(kāi)始下標(biāo)到結(jié)束下標(biāo)從前往后取,這個(gè)時(shí)候開(kāi)始下標(biāo)對(duì)應(yīng)的字符必須在結(jié)束下標(biāo)對(duì)應(yīng)的字符的前面;否則取到的是空串
當(dāng)步長(zhǎng)為負(fù).開(kāi)始下標(biāo)到結(jié)束下表從后往前取,這個(gè)時(shí)候開(kāi)始下標(biāo)對(duì)應(yīng)的字符必須在結(jié)束下標(biāo)對(duì)應(yīng)的字符的后面;否則取到的是空串
下標(biāo)可以越界
str2 = 'hello, python'
print(str2[0:4:1])
print(str2[0:4:2])
print(str2[0:5:3])
print(str2[-1:0:-1])
print(str2[8:-8:-1])
2)獲取部分字符2
a.省略步長(zhǎng):步長(zhǎng)為1
字符串[開(kāi)始下標(biāo):結(jié)束下標(biāo)] - 從開(kāi)始下標(biāo)到結(jié)束下標(biāo),從前往后一個(gè)一個(gè)地取
b.省略開(kāi)始下標(biāo)
字符串[:結(jié)束下標(biāo):步長(zhǎng)]吨灭、字符串[:結(jié)束下標(biāo)]
步長(zhǎng)為正:從字符串開(kāi)頭往后取; 步長(zhǎng)為負(fù),從最后一個(gè)字符往前取
c.省略結(jié)束下標(biāo)
字符串[開(kāi)始下標(biāo)::步長(zhǎng)]、字符串[開(kāi)始下標(biāo):]
步長(zhǎng)為正,從前往后取到最后一個(gè)字符; 步長(zhǎng)為負(fù),從后往前取到第一個(gè)字符
d.省略下標(biāo)
字符串[::步長(zhǎng)]刑巧、字符串[:]
3.遍歷字符串
1)直接遍歷拿到整個(gè)字符
for 變量 in 字符串:
循環(huán)體
循環(huán)過(guò)程中變量取到的就是字符串中的每個(gè)字符
for item in '雞你太美':
print(item)
for item in '雞你太美'[::-1]:
print(item)
2)通過(guò)遍歷下標(biāo)遍歷字符串
len(字符串) - 獲取字符串的長(zhǎng)度
str4 = '雞你太美!'
print(len(str4))
for index in range(len(str4)):
print(index, str4[index])
for index in range(-1, -len(str4)-1, -1):
print(index, str4[index])
1.數(shù)學(xué)運(yùn)算: +, *
1) 字符串1 + 字符串2 - 將兩個(gè)字符串拼接在一起產(chǎn)生一個(gè)新的字符串
注意: 字符串只能和字符串相加
str1 = 'abc' + '123'
print(str1)
str2 = 'how'
str3 = 'are'
str4 = str2 + str3
print(str2, str3, str4)
2) 字符串 * N /N * 字符串 - 字符串重復(fù)N次產(chǎn)生新的字符串
print('abc' * 3)
print(2 * '123')
2.比較運(yùn)算
1) 比較相等: ==, !=
print('abc' != 'acb')
2) 比較大小: >, <, >=, <=
字符串比較大小,比較的是字符串第一對(duì)不相等的字符的編碼值的大小
print('abc' > 'ac') # False
print('abc' > 'aac') # True 比較編碼大小
print('abcd' > 'abc') #True
#####a.判斷一個(gè)字符是否是大寫字母,是否小寫字母,是否是中文等...
小寫字母: 'a' <= 字符 <= 'z'
中文: '\u4e00' <= 字符 <= '\u49fa5'
數(shù)字: '0' <= 字符 <= '9'
***練習(xí): 1) 統(tǒng)計(jì)一個(gè)字符串中小寫字母的個(gè)數(shù)]
2)統(tǒng)計(jì)一個(gè)字符串中漢字的個(gè)數(shù)***
```python
str5 = 'How 你好嗎? hello ^_^; oh~ 天哪! '
count1 = 0
for item in str5:
if 'a' <= item <= 'z':
count1 += 1
print('小寫英文字母?jìng)€(gè)數(shù):', count1)
count2 = 0
for item in str5:
if '\u4e00'<= item <= '\u9fa5':
count2 += 1
print('中文漢字個(gè)數(shù):', count2)
3)統(tǒng)計(jì)字母?jìng)€(gè)數(shù)
str5 = 'How 你好嗎? hello ^_^; oh~ 天哪! '
count1 = 0
for item in str5:
if 'a' <= item <= 'z' or 'A' <= item <= 'Z':
count1 += 1
print('英文字母?jìng)€(gè)數(shù):', count1)
3.in / not in
字符串1 in 字符串2 - 判斷字符串2中是否包含字符串1
字符串1 not in 字符串2 - 判斷字符串2中是否不包含字符串1
4.len()
len(序列) - 獲取序列的長(zhǎng)度(序列中元素的個(gè)數(shù))
5.str(數(shù)據(jù)) - 將指定數(shù)據(jù)轉(zhuǎn)換成字符串
所有的數(shù)據(jù)都可以轉(zhuǎn)換成字符串;直接在數(shù)據(jù)的外面加引號(hào)
6.格式字符串
name = input('姓名:')
favorite = input('愛(ài)好:')
time = int(input('練習(xí)時(shí)長(zhǎng):'))
message = '我是練習(xí)時(shí)長(zhǎng)'+str(time)+'年的練習(xí)生'+name+',喜歡'+favorite+''
message = '我是練習(xí)時(shí)長(zhǎng)%d年的練習(xí)生%s,喜歡%s' % (time, name, favorite)
print(message)
1) 語(yǔ)法
包含格式占位符的字符串 % (格式占位符對(duì)應(yīng)的多個(gè)數(shù)據(jù))
%s - 字符串
%d - 整數(shù)
%.Nf - 小數(shù)(N為小數(shù)點(diǎn)后位數(shù),默認(rèn)為六位)
%c - 字符(可以將數(shù)字編碼轉(zhuǎn)換成字符)
%x - 轉(zhuǎn)換成16進(jìn)制
7.字符串的相關(guān)方法
字符串.函數(shù)名()
1) 對(duì)齊方式
字符串.center(寬度, 填充字符)
字符串.ljust(寬度, 填充字符)
字符串.rjust(寬度, 填充字符)
字符串.zfill(寬度) == 字符串.rjust(寬度)
str1 = 'abc'
print(str1.center(10, '$'))
print(str1.ljust(10, '&'))
print(str1.rjust(10, '^'))
print(str1.zfill(10))
2)統(tǒng)計(jì)個(gè)數(shù)
字符串1.count(字符串2) - 統(tǒng)計(jì)字符串1中字符串2的個(gè)數(shù)
str2 = 'how are you?fine,thanks,and you?'
print(str2.count('u'))
3)join函數(shù)
字符串.join(序列) - 將序列中的元素用指定的字符串連接在一起產(chǎn)生一個(gè)新的字符串
注意:序列的元素必須是字符串
print('*'.join('abc'))
print(','.join(['于婷', '張三', '小明']))
4)去掉空白字符
字符串.lstrip() = 去掉字符串左邊的空白
字符串.rstrip() = 去掉字符串右邊的空白
字符串.strip() = 去掉字符串兩邊的空白
str3 = ' 的 '
print(str3)
print('|'+str3+'|')
str3 = str3.lstrip()
print(str3)
print('|'+str3+'|')
5) 字符串替換
字符串.replace(字符串1, 字符串2) - 將字符串中的字符串1替換成字符串2
str4 = 'how are you'
new_str = str4.replace('o', 'h')
print(new_str)
6) 字符串切割
字符串.split(字符串1) - 將字符串按照字符串1進(jìn)行切割,結(jié)果是包含小字符串的列表
str5 = 'how are u i am fine thank you'
print(str5.split(' '))