聚沙成塔--爬蟲(chóng)系列(二)(python3基礎(chǔ)語(yǔ)法)

版權(quán)聲明:本文為作者原創(chuàng)文章凡傅,可以隨意轉(zhuǎn)載旺上,但必須在明確位置表明出處F柯臁!宣吱!

在開(kāi)始爬蟲(chóng)之前我們至少還需要知道python的基礎(chǔ)語(yǔ)法和基本數(shù)據(jù)類(lèi)型窃这、數(shù)據(jù)結(jié)構(gòu)。

可變數(shù)據(jù)類(lèi)型(mutable)和不可變數(shù)據(jù)類(lèi)型(immutable)

在python中數(shù)據(jù)類(lèi)型分為可變數(shù)據(jù)類(lèi)型和不可變數(shù)據(jù)類(lèi)型征候∏仗可變數(shù)據(jù)類(lèi)型指的是對(duì)象的內(nèi)容是可變的洒试,不可變數(shù)據(jù)類(lèi)型指的是對(duì)象的內(nèi)容是不可變的。可變和不可變數(shù)據(jù)類(lèi)型有以下幾種

  • 不可變數(shù)據(jù)類(lèi)型:int(整形類(lèi)型)卒煞, string(字符串類(lèi)型)痪宰, float(浮點(diǎn)數(shù)類(lèi)型),number(數(shù)值類(lèi)型)畔裕, tuple(元組類(lèi)型)
  • 可變數(shù)據(jù)類(lèi)型: list(列表類(lèi)型)衣撬,dict(字典類(lèi)型)。list列表數(shù)據(jù)類(lèi)型在內(nèi)存中是一種線(xiàn)性的存儲(chǔ)結(jié)構(gòu)扮饶,你可以把它想象成一個(gè)一維數(shù)組具练,每個(gè)索引在內(nèi)存中的存儲(chǔ)結(jié)構(gòu)是連續(xù)的。dict字典類(lèi)型是一種映射關(guān)系的數(shù)據(jù)類(lèi)型甜无,它是以key扛点,value的存儲(chǔ)結(jié)構(gòu)在內(nèi)存中存儲(chǔ)的,對(duì)于查找數(shù)據(jù)來(lái)說(shuō)岂丘,dict的效率是要遠(yuǎn)遠(yuǎn)大于list的陵究。所以如果我們要對(duì)大量數(shù)據(jù)進(jìn)行查找,那么用dict數(shù)據(jù)類(lèi)型存儲(chǔ)記錄是種不錯(cuò)的選擇奥帘,python意圖把全世界的對(duì)象的變成字典結(jié)構(gòu)铜邮。

不可變數(shù)據(jù)類(lèi)型需要注意的地方

不可變數(shù)據(jù)類(lèi)型特別需要主要的是數(shù)值類(lèi)型,python3中把-5-256作為常用的數(shù)值寨蹋,如果變量指向在這個(gè)區(qū)間的相同值松蒜,那么他們的地址是不變的,這個(gè)時(shí)候在你寫(xiě)邏輯判斷的時(shí)候你可以使用a == b或者a is b這兩種方式都是可以的已旧, 但是如果超出這個(gè)范圍秸苗, 那么邏輯判斷a == b返回True,a is b返回False评姨,這點(diǎn)大家一定要切記难述!切記

什么是不可變數(shù)據(jù)類(lèi)型

不可變數(shù)據(jù)類(lèi)型指的是其指向該對(duì)象的值是不可變的吐句,對(duì)于字符串是不可變數(shù)據(jù)類(lèi)型胁后,str 賦值為“hello world”然后查看其id(str)值,然后在給str賦值為“hello”, 再使用id(str)查看啟id值嗦枢,這個(gè)時(shí)候可以看到前后的id值并不是一樣的攀芯,那么就可以證明后一個(gè)str賦值是重新創(chuàng)建了一個(gè)對(duì)象,如下圖所示:


對(duì)與不可變數(shù)據(jù)類(lèi)型文虏,元組數(shù)據(jù)結(jié)構(gòu)類(lèi)型更容以看出來(lái)侣诺,因?yàn)槲覀冎灰獙?duì)元組的值進(jìn)行修改python解釋器就會(huì)拋出異常錯(cuò)誤殖演,如下圖所示:


雖然元組數(shù)據(jù)結(jié)構(gòu)類(lèi)型是不可變數(shù)據(jù)類(lèi)型,但是它可以包涵可變數(shù)據(jù)結(jié)構(gòu)類(lèi)型如list年鸳、dict如下圖所示:


list是可變數(shù)據(jù)結(jié)構(gòu)類(lèi)型趴久,所以這里對(duì)list的第一個(gè)元素也就是下標(biāo)索引0的值重新賦值為100是可行的。

可變數(shù)據(jù)類(lèi)型

列表數(shù)據(jù)類(lèi)型(list)搔确、字典數(shù)據(jù)類(lèi)型(dict)是可變數(shù)據(jù)類(lèi)型彼棍,與不可變數(shù)據(jù)類(lèi)型相反,可變數(shù)據(jù)類(lèi)型是指它所指向的對(duì)象的值是可變的膳算,需要值得主要的一點(diǎn)是字段數(shù)據(jù)類(lèi)型(dict),字典數(shù)據(jù)類(lèi)型是key座硕,value鍵值對(duì)映射結(jié)構(gòu)類(lèi)型的,它的key是不能對(duì)應(yīng)多個(gè)值的涕蜂,如果對(duì)同一個(gè)key賦值华匾,結(jié)果就是被最后一次的值覆蓋,如下圖所示:

字符串切片

字符串切片是python處理字符串不得不了解的知識(shí)點(diǎn)机隙,我認(rèn)為python對(duì)字符串分割的處理是所有語(yǔ)言中做得最牛X的蜘拉。

# 字符串切片

str = 'abcdefghijklmn'
print ('str = %s' % str)
#保留從第三個(gè)位置開(kāi)始的所有字符串
print('保留從第三個(gè)位置開(kāi)始的所有字符串:%s' % str[3:])

#從第三個(gè)位置開(kāi)始往后切三個(gè)字符
print('從第三個(gè)位置開(kāi)始往后切三個(gè)字符:%s' % str[3:6])

#去掉最后三個(gè)字符
print('去掉最后三個(gè)字符:%s' % str[:-3])

#保留最后三個(gè)字符
print('保留最后三個(gè)字符:%s' % str[-3:])

#逆序
print('逆序:%s' % str[::-1])

#隔一個(gè)字符逆序
print('隔一個(gè)字符逆序:%s' % str[::-2])

#取出每隔三個(gè)字符
print('取出每隔三個(gè)字符:%s' % str[::3])

#從第二個(gè)字符每隔三個(gè)字符取一個(gè)字符
print('從第二個(gè)字符每隔三個(gè)字符取一個(gè)字符:%s' % str[2::3])

#復(fù)制字符串str
str1 = str[:]
print('復(fù)制字符串str:%s' % str1)

執(zhí)行結(jié)果

str = abcdefghijklmn
保留從第三個(gè)位置開(kāi)始的所有字符串:defghijklmn
從第三個(gè)位置開(kāi)始往后切三個(gè)字符:def
去掉最后三個(gè)字符:abcdefghijk
保留最后三個(gè)字符:lmn
逆序:nmlkjihgfedcba
隔一個(gè)字符逆序:nljhfdb
取出每隔三個(gè)字符:adgjm
從第二個(gè)字符每隔三個(gè)字符取一個(gè)字符:cfil
復(fù)制字符串str:abcdefghijklmn

條件和循環(huán)語(yǔ)句

python有最嚴(yán)格的語(yǔ)法縮進(jìn)語(yǔ)法,表達(dá)式的主題部分和表達(dá)式需要有4個(gè)空格的縮進(jìn)黍瞧,在我用sublime編輯器或者其它編輯器的時(shí)候需要設(shè)置tab鍵為4個(gè)空格诸尽。

  • if條件語(yǔ)句
if expression:
    expr_true_suite
elif expression:
    expr_true_suite
else:
    expr_false_suite

條件判斷語(yǔ)句,if expression(如果條件成立)那么執(zhí)行 expr_true_suite印颤, 如果不成立然后去判斷elif expression:這個(gè)表達(dá)式的邏輯是否成立您机,如果成立則執(zhí)行expr_true_suite,如果條件都不滿(mǎn)足年局,則執(zhí)行最后的else邏輯际看。條件表達(dá)示中可以有多個(gè)elif語(yǔ)句,也可以一個(gè)都沒(méi)有矢否,看應(yīng)用程序中具體的邏輯判斷條件仲闽。

  • while循環(huán)語(yǔ)句
while expression:
    suite_to_repeat

while 循環(huán)的 suite_to_repeat 子句會(huì)一直循環(huán)執(zhí)行, 直到 expression 值為布爾假。

count = 0
while (count < 9):
    print ('the index is:%d' % count)
    count += 1

for循環(huán)語(yǔ)句

for item in [0,1,2,3]:
    print(item)
結(jié)果
0
1
2
3

for循環(huán)是傳統(tǒng)的計(jì)數(shù)循環(huán)僵朗,直到循環(huán)到最后一個(gè)元素為止

函數(shù)

函數(shù)是對(duì)程序邏輯進(jìn)行結(jié)構(gòu)化或過(guò)程化的一種編程方法赖欣。能將整塊代碼巧妙地隔離成易于管理的小塊,把重復(fù)代碼放到函數(shù)中而不是進(jìn)行大量的拷貝--這樣既能節(jié)省空間验庙,也有助于保持一致性顶吮,因?yàn)槟阒恍韪淖儐蝹€(gè)的拷貝而無(wú)須去尋找再修改大量復(fù)制代碼的拷貝。
函數(shù)的定義:

def func1():
    do something...

def func(param1, param2):
    do something...
    return xxx

函數(shù)可以有參數(shù)粪薛,也可有沒(méi)有參數(shù)悴了,函數(shù)可以有返回值,也可以沒(méi)有返回值,具體情況具體應(yīng)用湃交∈炜眨基礎(chǔ)的語(yǔ)法部分就到這里結(jié)束,下一篇將介紹正則表達(dá)式的使用搞莺,學(xué)會(huì)正則表達(dá)式的使用就能爬一些簡(jiǎn)單的網(wǎng)址了息罗,python中其它高級(jí)的用法我們?cè)趯?xiě)爬蟲(chóng)中遇到了在回過(guò)頭了學(xué)習(xí)。


歡迎關(guān)注我的公眾號(hào):愛(ài)做飯的老謝才沧,老謝一直在努力...

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末阱当,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子糜工,更是在濱河造成了極大的恐慌,老刑警劉巖录淡,帶你破解...
    沈念sama閱讀 212,718評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件捌木,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡嫉戚,警方通過(guò)查閱死者的電腦和手機(jī)刨裆,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,683評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)彬檀,“玉大人帆啃,你說(shuō)我怎么就攤上這事∏系郏” “怎么了努潘?”我有些...
    開(kāi)封第一講書(shū)人閱讀 158,207評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)坤学。 經(jīng)常有香客問(wèn)我疯坤,道長(zhǎng),這世上最難降的妖魔是什么深浮? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,755評(píng)論 1 284
  • 正文 為了忘掉前任压怠,我火速辦了婚禮,結(jié)果婚禮上飞苇,老公的妹妹穿的比我還像新娘菌瘫。我一直安慰自己,他們只是感情好布卡,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,862評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布雨让。 她就那樣靜靜地躺著,像睡著了一般羽利。 火紅的嫁衣襯著肌膚如雪宫患。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 50,050評(píng)論 1 291
  • 那天,我揣著相機(jī)與錄音娃闲,去河邊找鬼虚汛。 笑死,一個(gè)胖子當(dāng)著我的面吹牛皇帮,可吹牛的內(nèi)容都是我干的卷哩。 我是一名探鬼主播,決...
    沈念sama閱讀 39,136評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼属拾,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼将谊!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起渐白,我...
    開(kāi)封第一講書(shū)人閱讀 37,882評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤尊浓,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,330評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蝙叛,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,651評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了瓦堵。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,789評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡歌亲,死狀恐怖菇用,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情陷揪,我是刑警寧澤惋鸥,帶...
    沈念sama閱讀 34,477評(píng)論 4 333
  • 正文 年R本政府宣布,位于F島的核電站鹅龄,受9級(jí)特大地震影響揩慕,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜扮休,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,135評(píng)論 3 317
  • 文/蒙蒙 一迎卤、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧玷坠,春花似錦蜗搔、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,864評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至兄渺,卻和暖如春缝龄,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,099評(píng)論 1 267
  • 我被黑心中介騙來(lái)泰國(guó)打工叔壤, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留瞎饲,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,598評(píng)論 2 362
  • 正文 我出身青樓炼绘,卻偏偏與公主長(zhǎng)得像嗅战,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子俺亮,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,697評(píng)論 2 351

推薦閱讀更多精彩內(nèi)容

  • 一驮捍、python 變量和數(shù)據(jù)類(lèi)型 1.整數(shù) Python可以處理任意大小的整數(shù),當(dāng)然包括負(fù)整數(shù)脚曾,在Python程序...
    績(jī)重KF閱讀 1,664評(píng)論 0 1
  • 最近在慕課網(wǎng)學(xué)習(xí)廖雪峰老師的Python進(jìn)階課程东且,做筆記總結(jié)一下重點(diǎn)。 基本變量及其類(lèi)型 變量 在Python中本讥,...
    victorsungo閱讀 1,671評(píng)論 0 5
  • http://python.jobbole.com/85231/ 關(guān)于專(zhuān)業(yè)技能寫(xiě)完項(xiàng)目接著寫(xiě)寫(xiě)一名3年工作經(jīng)驗(yàn)的J...
    燕京博士閱讀 7,560評(píng)論 1 118
  • 文/Bruce.Liu1 1.運(yùn)算符 本章節(jié)主要說(shuō)明Python的運(yùn)算符囤踩。舉個(gè)簡(jiǎn)單的例子 4 +5 = 9 。 例...
    BruceLiu1閱讀 767評(píng)論 0 6
  • 本教程基于Python 3晓褪,參考 A Byte of Python v1.92(for Python 3.0) 以...
    yuhuan121閱讀 3,047評(píng)論 1 6