Nodepad++雖然只能用于Windows弟翘,但作為一個免費開源編輯器近忙,卻是一個利器。一直非常喜歡嘱兼,也是看最初的源碼国葬,才知道純Win32的接口寫出來的窗體程序,也可以做到如此精湛芹壕。比MFC那套的代碼好多了汇四。也正因如此,Nodepad++程序體積一直都很小踢涌。雖小通孽,但功能卻非常多,今天分享的是工作中會用到的利用正則表達(dá)式對文本進(jìn)行替換睁壁。
行前添加字符
比較簡單的背苦,但可能經(jīng)常會用到,在所有行前面加上某些字符潘明,比如4個空格
替換前:
替換后:
^這個符號在正則表達(dá)式中表示行首行剂。注意在面板下方的查找模式中,需要選中“正則表達(dá)式”選項钳降,如果是只替換選中的部分厚宰,記得勾選“選取范圍內(nèi)”這個復(fù)選框,如果不勾選遂填,則是對整個文件生效固阁。將會在文件中的所有行前面加上4個空格壤躲。
行尾添加字符
替換前:
替換后:
$符號在正則表達(dá)式中表示行尾的意思。
在復(fù)雜信息中快速整合部分有用信息
根據(jù)需要备燃,找到了一個 ICAO24的碼表碉克,雖然數(shù)據(jù)量并不大,但如果完全手動一條一條數(shù)據(jù)復(fù)制粘貼到我們的代碼中并齐,還是會耗費大量的時間漏麦,接下來就說明一下我們?nèi)绾斡肗odepad++的正則表達(dá)式替換功能來解決這個實際問題。
首先况褪,查看網(wǎng)頁源代碼撕贞,然后把ICAO24的表格數(shù)據(jù)復(fù)制到Nodepad++新建的文件中,如下:
從上圖中中可以看到测垛,這里有很多無用數(shù)據(jù)捏膨。對于我們來說,我們需要的是第一列的Country和第三列的地址范圍食侮,其他的都不需要号涯。所以,得想辦法把無關(guān)緊要的東西先排除掉锯七。按照順序链快,我們先去掉每一行前面的<tr class='odd'>這樣的數(shù)據(jù):
如上圖,直接把匹配的字符串替換為空眉尸,就去除了域蜗。然后,按照同樣的方法再干掉不需要的第二列:
用同樣的方法噪猾,再把范圍列之后的所有數(shù)據(jù)都干掉:
這個時候霉祸,就只剩下了我們需要的Country列和地址范圍列,數(shù)據(jù)干凈多了袱蜡。根據(jù)需要脉执,應(yīng)該把范圍的起始地址和結(jié)束地址取出來,并直接整合到我們的代碼中戒劫,下面先把Country和范圍分行:
注意半夷,可以使用\n表示換行。換行后迅细,就可以提取范圍的起始和結(jié)束值巫橄,并整合進(jìn)代碼中,假設(shè)我們使用c++的vector來存儲茵典,變量名為acio24Ranges湘换,那么我們可以這樣做:
注意:在上圖中,替換為里面有點新知識,就是"\1"彩倚,這個地方代表的是正則表達(dá)式里面的第一個(.*)的內(nèi)容筹我,以此類推,第一個(.*)就用"\2"表示帆离。這樣就能做到原封不動的保留我們需要的字符蔬蕊。最后我們就只剩下處理Country了,假設(shè)我們使用c++的vector來存儲哥谷,變量名為countries岸夯,處理手法同上:
如上圖所示,這樣我們就得到了我們想要的數(shù)據(jù)们妥,并整合進(jìn)代碼中猜扮。
上面的步驟還可以優(yōu)化,有興趣的朋友可以自己試試监婶,我只在這里拋塊磚而已旅赢。希望大家能有效利用這個功能,提高工作效率惑惶,真正得到實惠煮盼!有不明白的地方,可以加Q群280689979 進(jìn)行溝通交流集惋。