本系列文章立志于從一個(gè)已經(jīng)習(xí)得一門編程語(yǔ)言的基礎(chǔ)之上,全面介紹Python的相關(guān)開發(fā)過(guò)程和相關(guān)經(jīng)驗(yàn)總結(jié)帆精。本篇文章主要是基于上一篇的程序員帶你十天快速入門Python,玩轉(zhuǎn)電腦軟件開發(fā)(三)的基礎(chǔ)之上建蹄,進(jìn)行深入學(xué)習(xí)零院。
最新文章會(huì)更新在今日頭條-做全棧攻城獅劳吠。大約發(fā)布時(shí)間為晚上。希望各位能依靠睡前強(qiáng)大的記憶力宪赶,習(xí)得Python知識(shí)宗弯。
1.Python模塊
正是因?yàn)镻ython有大量豐富易用的模塊才使Python變得豐富多彩。模塊是能處理某種功能的集合搂妻。相較于函數(shù)來(lái)說(shuō)蒙保,模塊是更大的集合,如果說(shuō)函數(shù)比作剪子剪東西的話欲主,那么模塊可以泛指可以很多剪東西的工具邓厕。
因?yàn)镻ython模塊化編程,使更加輕便的使用模塊扁瓢。所以在使用模塊的時(shí)候我們需要導(dǎo)入米塊详恼。類似于Java里面的包和C#中的命名空間。
雖有兩種形式引几,但比較推薦第二種昧互。想要那部分方法就導(dǎo)入到py文件,而非臃腫的導(dǎo)入伟桅。
2.自定義模塊
到底什么事模塊呢》用面向?qū)ο蟮乃枷雭?lái)說(shuō)應(yīng)該就是某類對(duì)象敞掘。落實(shí)到代碼上就是類的編寫。所以我們只是需要編寫一個(gè)簡(jiǎn)單的py文件楣铁。如下圖:
自定義的py文件需要放入python語(yǔ)言包安裝目錄的lib文件夾下面玖雁。
導(dǎo)入模塊代碼
2.Python正則表達(dá)式。
正則表達(dá)式是字符串用來(lái)進(jìn)行規(guī)則匹配的語(yǔ)法盖腕。如同赫冬,我們想要在大批量的文件中找出來(lái)含有關(guān)鍵詞王寶強(qiáng)的段落,我們就要找出首句空兩格赊堪,并且含有王寶強(qiáng)的以下一段空兩格結(jié)尾的語(yǔ)句面殖。這就是自己需要的。而正則表達(dá)式就規(guī)定了這些規(guī)則哭廉。用來(lái)提取或者使用脊僚。
正則表達(dá)式 都是很通用的。所以在任何語(yǔ)言中遵绰,使用的正則表達(dá)式都是一樣的辽幌。只是可能不同的語(yǔ)言提供不同的調(diào)用匹配正則的方式方法略有不同。值得注意的是正則表達(dá)式的對(duì)象是字符串椿访。在字符串內(nèi)部提取匹配乌企。
首先我們一起回顧一下正則表達(dá)式的語(yǔ)法:
.(英語(yǔ)句號(hào)) —-表示除/n之外的任意字符。 比如a.b 可以匹配出來(lái)a*b abb acb成玫。英文句號(hào)就可以代表一個(gè)字符加酵。 也是相當(dāng)于占位拳喻。一些特殊的符號(hào)。
[] —-字符的篩選 [abc]d 表示ad bd 或者cd []表示這個(gè)字符的這一位猪腕,只能包含中括號(hào)中包含的字符冗澈。 當(dāng)然還有些特殊的 例如[a-z] 表示字母a到z的匹配 [0-9] (可以用/d表示) 表示數(shù)字0-9的匹配
^ ——字符的開頭
$——-字符的結(jié)尾
| ——可以理解為或者,這個(gè)運(yùn)算符優(yōu)先級(jí) 最低 例如z|food可以匹配出來(lái)z或者food
*——限定前面的字符出現(xiàn)0次或者多次 例如 v* 可以表示 沒(méi)有字符和 多個(gè)v組成的字符
+—–限定為前面的字符出現(xiàn)1次或者多次 例如 v+ 可以表示v和多個(gè)v組成的字符
?—-限定前面的表達(dá)式必須出現(xiàn)一次或者0次陋葡。
{10} —表示前面的字符串必須出現(xiàn)10次
{n,}—–至少出現(xiàn)n次
下一節(jié)我們使用正則表達(dá)式來(lái)實(shí)現(xiàn)網(wǎng)頁(yè)爬蟲的效果亚亲。
請(qǐng)關(guān)注下節(jié)教程。
關(guān)注-做全棧攻城獅獲取最新資訊腐缤。寫代碼也要讀書捌归,愛全棧,更愛生活岭粤。程序員不止會(huì)寫代碼惜索,好智商,高情商绍在,我們的選擇门扇。