python大大的圖
作業(yè)圖
1嫂冻、urllib
urllib模塊提供的上層接口言询,使我們可以像讀取本地文件一樣讀取www和ftp上的數(shù)據(jù)恩闻。
2稍刀、re
re模塊為高級字符串處理提供了正則表達式工具罩抗。對于復雜的匹配和處理强品,正則表達式提供了簡潔扶平、優(yōu)化的解決方案盏触。
python大大的解答:
其實這用re是過濾網(wǎng)頁html符號愉耙,只顯示我們關(guān)注的文字贮尉。
3、ulretrieve
直接將遠程數(shù)據(jù)下載到本地朴沿。
4猜谚、re.sub()
re是regular expression的所寫,表示正則表達式赌渣。sub是substitute的所寫魏铅,表示替換;re.sub是個正則表達式方面的函數(shù)坚芜,用來實現(xiàn)通過正則表達式览芳,實現(xiàn)比普通字符串的replace更加強大的替換功能。
5鸿竖、非貪婪模式
“*沧竟?”的組合是非貪婪模式铸敏。貪婪模式,總是嘗試匹配盡可能多的字符悟泵; 非貪婪模式則相反杈笔,總是嘗試匹配盡可能少的字符。
6糕非、join()
連接字符串數(shù)組蒙具。將字符串、元組朽肥、列表中的元素以指定的字符(分隔符)連接生成一個新的字符串禁筏。