1、len()函數(shù)
Len()函數(shù)的基本用法如下:
len(string)
其中短荐,string 用于指定要進(jìn)行長(zhǎng)度統(tǒng)計(jì)的字符串倚舀。
2、切片法截取字符串
切片法截取字符串的語(yǔ)法格式如下:
string[start : end : step]
參數(shù)說(shuō)明:
string:表示要截取的字符串忍宋。
start:表示要截取的第一個(gè)字符的索引(包括該字符)痕貌,如果不指定,則默認(rèn)為0糠排。
end:表示要截取的最后一個(gè)字符的索引(不包括該字符)芯侥,如果不指定則默認(rèn)為字符串
的長(zhǎng)度。
step:表示切片的步長(zhǎng)乳讥,如果省略柱查,則默認(rèn)為1,當(dāng)省略該步長(zhǎng)時(shí)云石,最后一個(gè)冒號(hào)也可
以省略唉工。
3、分割字符串
split()方法的語(yǔ)法格式如下:
str.split(sep, maxsplit)
參數(shù)說(shuō)明:
str:表示要進(jìn)行分割的字符串汹忠。
sep:用于指定分隔符淋硝,可以包含多個(gè)字符雹熬,默認(rèn)為None,即所有空字符(包括空格谣膳、
換行“\n”竿报、制表符“\t”等)。
maxsplit:可選參數(shù)继谚,用于指定分割的次數(shù)烈菌,如果不指定或者為-1,則分割次數(shù)沒有限
制花履,否則返回結(jié)果列表的元素個(gè)數(shù)芽世,個(gè)數(shù)最多為maxsplit+1。
返回值:分隔后的字符串列表诡壁。
4济瓢、合并字符串
join()方法的語(yǔ)法格式如下:
strnew = string.join(iterable)
參數(shù)說(shuō)明:
strnew:表示合并后生成的新字符串。
零基礎(chǔ)學(xué)Python
string:字符串類型妹卿,用于指定合并時(shí)的分隔符旺矾。
iterable:可迭代對(duì)象,該迭代對(duì)象中的所有元素(字符串表示)將被合并為一個(gè)新的字
符串夺克。string 作為邊界點(diǎn)分割出來(lái)箕宙。
5、常用的格式化字符
格式化字符說(shuō)明
%s 字符串(采用str()顯示)
%c 單個(gè)字符
%d 或者%i 十進(jìn)制整數(shù)
%x 十六進(jìn)制整數(shù)
%f 或者%F 浮點(diǎn)數(shù)
%r 字符串(采用repr()顯示)
%o 八進(jìn)制整數(shù)
%e 指數(shù)(基底寫為e)
%E 指數(shù)(基底寫為E)
%% 字符%
6懊直、format()方法中常用的格式化字符
格式化字符說(shuō)明
s 對(duì)字符串類型格式化
d 十進(jìn)制整數(shù)
c 將十進(jìn)制整數(shù)自動(dòng)轉(zhuǎn)換成對(duì)應(yīng)的Unicode 字符
e 或者E 轉(zhuǎn)換為科學(xué)計(jì)數(shù)法表示再格式化
g 或者G 自動(dòng)在e 和f 或者E 和F 中切換
b 將十進(jìn)制整數(shù)自動(dòng)轉(zhuǎn)換成二進(jìn)制表示再格式化
o 將十進(jìn)制整數(shù)自動(dòng)轉(zhuǎn)換成八進(jìn)制表示再格式化
x 或者X 將十進(jìn)制整數(shù)自動(dòng)轉(zhuǎn)換成十六進(jìn)制表示再格式化
f 或者F 轉(zhuǎn)換為浮點(diǎn)數(shù)(默認(rèn)小數(shù)點(diǎn)后保留6 位)再格式化
% 顯示百分比(默認(rèn)顯示小數(shù)點(diǎn)后6 位)
7、使用encode()方法編碼
encode()方法的語(yǔ)法格式如下:
str.encode([encoding="utf-8"][,errors="strict"])
參數(shù)說(shuō)明:
str:表示要進(jìn)行轉(zhuǎn)換的字符串火鼻。
encoding="utf-8":可選參數(shù)室囊,用于指定進(jìn)行轉(zhuǎn)碼時(shí)采用的字符編碼,默認(rèn)為UTF-8魁索,如
果想使用簡(jiǎn)體中文融撞,也可以設(shè)置為gb2312。當(dāng)只有這一個(gè)參數(shù)時(shí)粗蔚,也可以省略前面的“enc
oding=”尝偎,直接寫編碼。
errors="strict":可選參數(shù)鹏控,用于指定錯(cuò)誤處理方式致扯,其可選擇值可以是strict(遇到非法
字符就拋出異常)、ignore(忽略非法字符)当辐、replace(用“?”替換非法字符)或xmlcharref
replace(使用XML 的字符引用)等抖僵,默認(rèn)值為strict。
8缘揪、使用decode()方法解碼
decode()方法的語(yǔ)法格式如下:
bytes.decode([encoding="utf-8"][,errors="strict"])
參數(shù)說(shuō)明:
bytes:表示要進(jìn)行轉(zhuǎn)換的二進(jìn)制數(shù)據(jù)耍群,通常是encode()方法轉(zhuǎn)換的結(jié)果义桂。
encoding="utf-8":可選參數(shù),用于指定進(jìn)行解碼時(shí)采用的字符編碼蹈垢,默認(rèn)為UTF-8慷吊,如
果想使用簡(jiǎn)體中文,也可以設(shè)置為gb2312曹抬。當(dāng)只有這一個(gè)參數(shù)時(shí)溉瓶,也可以省略前面的
“encoding=”,直接寫編碼沐祷。
9嚷闭、常用元字符
代碼說(shuō)明
. 匹配除換行符以外的任意字符
\w 匹配字母或數(shù)字或下劃線或漢字
\s 匹配任意的空白符
\d 匹配數(shù)字
\b 匹配單詞的開始或結(jié)束
^ 匹配字符串的開始
$ 匹配字符串的結(jié)束
10、常用限定符
限定符說(shuō)明舉例
? 匹配前面的字符零次或一次colou?r赖临,該表達(dá)式可以匹配colour 和color
+ 匹配前面的字符一次或多次go+gle胞锰,該表達(dá)式可以匹配的范圍從gogle 到goo…gle
* 匹配前面的字符零次或多次go*gle,該表達(dá)式可以匹配的范圍從ggle 到goo…gle
{n} 匹配前面的字符n 次go{2}gle兢榨,該表達(dá)式只匹配google
{n,} 匹配前面的字符最少n 次go{2,}gle嗅榕,該表達(dá)式可以匹配的范圍從google 到goo…gle
{n,m} 匹配前面的字符最少n 次,最
多m 次
employe{0,2}吵聪,該表達(dá)式可以匹配employ凌那、employe 和
employee 3 種情況