字符串和正則表達(dá)式day 12
學(xué)習(xí)計(jì)劃:
- day12的內(nèi)容
學(xué)習(xí)內(nèi)容:
- 知道了正則表達(dá)式的形式俐末,相當(dāng)于要提取被匹配的字符串公共特點(diǎn)围辙,然后轉(zhuǎn)化成規(guī)定的元字符,注意MECE原則(我認(rèn)為的),即不重復(fù)赎败,無(wú)遺漏;同時(shí)注意匹配的字符串是獨(dú)立的還是前后有字符蠢甲。
- 學(xué)會(huì)了python里面對(duì)正則表達(dá)式的應(yīng)用僵刮,如
compile
(書寫正則表達(dá)式),match
(匹配)split
(按字符分離),sub
(替換) - 知道了正則表達(dá)式的應(yīng)用,廣泛用于爬蟲鹦牛,是收集數(shù)據(jù)的好方法
對(duì)python的話:
今天的我非常的磨蹭搞糕,為什么呢?大概是進(jìn)入了倦怠期曼追,或者是一直看書窍仰,沒(méi)有操作,腦子不會(huì)轉(zhuǎn)了礼殊,在學(xué)習(xí)時(shí)驹吮,還是要多多提問(wèn)自己针史,動(dòng)手打代碼之類的
未做的事:
- Latex安裝并按照spyder學(xué)習(xí)
- 字符編碼和unicode
文章的替換,從打開文件碟狞,到替換文字啄枕,再到生成新的文件