可能大多數(shù)人在學(xué)習(xí)C語言的時候毫胜,最先接觸的數(shù)據(jù)類型就是字符串赠制,因為大多教程都是
以"Hello world"這個程序作為入門程序惯悠,這個程序中要打印的"Hello
world"就是字符串躬络。如果你做過自然語言處理方面的研究蜡吧,并且用Python去做過相關(guān)實驗,你肯定會體會到Python在字符串處理方面相對于其他
語言的明顯優(yōu)勢之處征绎。今天我們來了解一下Python中的字符串蹲姐,看看它的用法。
一.Python中如何聲明字符串
在Python中聲明一個字符串通常有三種方法:在它的兩邊加上那個單引號、雙引號或者三引號淤堵。
如:
從上面可以看出三種聲明方法的效果是完全一樣的寝衫,在Python中用這三種聲明方法來聲明字符串意義完全等同的顷扩,即'hello
world'和"hello world"以及'''hello
world'''是沒有任何區(qū)別的拐邪。但是會有人問:既然是完全等同的,為什么要弄出三種聲明方式呢隘截?下面看一下這幾個例子:
在Python中提供了這幾種方法扎阶,使得使用起來更加方便靈活(當然也可以使用轉(zhuǎn)義字符去解決上面報錯的地方)。
在這里要注意的是婶芭,
1)在Python中沒有類似C語言中char這種類型的字符串东臀,也就是說即使是單個字符也是字符串。
2)Python中的字符串一旦聲明犀农,是不能進行更改的惰赋,即不能通過對某一位置重新賦值改變內(nèi)容。
二.Python中的字符串類型
Python中的字符串有兩種數(shù)據(jù)類型:str類型和unicode類型呵哨。str類型采用的ASCII編碼赁濒,也就是說它無法表示中文。unicode類型采用unicode編碼孟害,能夠表示任意的字符拒炎,包括中文、日文挨务、韓文等击你。
在python中字符串默認采用的ASCII編碼,如果要顯示聲明為unicode類型的話谎柄,需要在字符串前面加上'u'或者'U'丁侄。
下面看一段代碼
print'我'printu'我'print'python'printu'python'
這段代碼的運行結(jié)果為:
從運行結(jié)果可以看出,如果是中文的話朝巫,不采用unicode類型鸿摇,輸出的會是亂碼。
三.轉(zhuǎn)義字符和原始字符串
同C語言中一樣捍歪,Python中也有轉(zhuǎn)義字符户辱,用反斜杠'\'來表示對后面字符進行轉(zhuǎn)義。
比如上面例子中的問題就可以用轉(zhuǎn)義來解決:
如果你編寫過Java程序糙臼,并且使用過Java中的正則表達式庐镐,你可能會對Java正則表達式深惡痛絕(我自己就是),因為稍不注意就會出錯变逃,
里面有太多的轉(zhuǎn)義必逆,而且看起來也很繁瑣雜亂。在Python中,你不必再為這個問題煩惱了名眉,因為Python提供了原始字符串,顧名思義损拢,就是保留原始字
符的意思陌粹,不對反斜杠及反斜杠后面的字符進行轉(zhuǎn)義,聲明原始字符串的方法是在字符串前面加上'r'或者'R'福压。
在這里要注意:在Python中行尾結(jié)束符始終為'\n'掏秩,不論Python程序在哪個操作系統(tǒng)下運行。在Linux環(huán)境下編寫C語言時荆姆,換行符為'\n'蒙幻,而在windows下為'\r\n'。編寫Python程序不用擔心這種因運行環(huán)境不同引起的不兼容問題胆筒。
四.用戶輸入以及格式化輸出字符串
在Python中最常用的從鍵盤獲取輸入的函數(shù)是raw_input()和input()邮破。但是這兩個函數(shù)有很大的區(qū)別:
raw_input()以字符串的形式返回用戶輸入的一切內(nèi)容;
而input()卻不是這樣仆救,它會根據(jù)輸入內(nèi)容的形式確定返回的形式(可能有點拗口)抒和。下面看個例子就明白了:
從這個例子顯而易見可以看出兩者的區(qū)別,同樣輸入123派桩,raw_input()返回的是字符串123构诚,而input()返回的是整數(shù)123。個人建議一般情況下使用raw_input()獲取輸入铆惑,這樣能避免程序中出現(xiàn)一些不必要的麻煩范嘱。
同C語言一樣,Python中也提供了格式化輸出员魏。
Python中的格式化輸出和C語言類似丑蛤,基本格式如下:
print '....%formmat..' %(var...)
當var只有一個時,括號可以省略撕阎。
關(guān)于Python的字符串今天就討論這么多了受裹,在這里只是討論了基本的概念和知識點,相關(guān)字符串函數(shù)的使用請查閱API文檔虏束。
作者:海子
出處:http://www.cnblogs.com/dolphin0520/
棉饶。