Perl, Python和Emacs中正則表達(dá)式的比較

去年立下的flag,試著對(duì)這篇博文進(jìn)行翻譯:
https://www.johndcook.com/blog/regex-perl-python-emacs/
現(xiàn)在要兌現(xiàn)了:

正則表達(dá)式非常方便摔刁,但是在不同場(chǎng)景下的實(shí)現(xiàn)不盡相同齿尽。本文將對(duì)正則表達(dá)式在Perl, Python和Emacs中的異同作一些總結(jié)哨苛,但不能做到面面俱到均蜜。

文中的提到“Python”正則但绕,指的是2015年底re模塊所實(shí)現(xiàn)的版本却特,據(jù)說(shuō)還有一些更兼容Perl的選項(xiàng)扶供,將來(lái)可能會(huì)被合并到官方版中。

此外裂明,本文注重正則表達(dá)式的語(yǔ)法椿浓,而非如何使用。更多地關(guān)注于常見(jiàn)任務(wù)中正則表達(dá)式的比較闽晦,比如在Perl和Python中的搜索與替換扳碍。

Emacs, Python, Perl中正則表達(dá)式的共同特性

在所有的實(shí)現(xiàn)中,最基本的regex特征都是一致的:通配符(.)仙蛉,量化符(*,+,?)笋敞,錨點(diǎn)(^,$),[]內(nèi)的字符和反向引用(\1,\2,\3)等荠瘪。

最新的Emacs版本支持\b表示詞邊界(word boundaries)夯巷,\B表示非詞邊界(non-word boundaries),\w表示單詞字符(word characters)哀墓,\W表示非單詞字符(non-word characters)趁餐。

通常Emacs只支持最古老的正則特性,但也支持相對(duì)較新的非貪婪量化符(non-greedy quantifiers)篮绰,如*?,+?,??后雷。

Emacs中的基本特性都需要反斜杠(\

替換符在Perl和Python中都是用|表示,但在Emacs中必須寫成\|阶牍,類似地喷面,括號(hào)在Emacs中也必須轉(zhuǎn)義為\(\)。同樣的還有表示匹配次數(shù)的大括號(hào)\{\}走孽。

Emacs支持的一個(gè)新特性是非分組括號(hào)(non-grouping parentheses)惧辈,然而這也需要用反斜杠轉(zhuǎn)義作:\(?:...\)

Emacs特有的特性

語(yǔ)法類

Emacs中的語(yǔ)法類以\s打頭磕瓷,跟其他正則慣例一樣盒齿,否定使用大寫字母\S念逞。

例如,\s.表示任意標(biāo)點(diǎn)符號(hào)边翁,而\S.表示任何非標(biāo)點(diǎn)翎承。Emacs還使用\s(\s)表示定界符(分隔符,delimiters)的開(kāi)始與結(jié)尾符匾,\s<\s>表示注釋的開(kāi)頭和結(jié)尾叨咖,等等。

需要注意的是啊胶,由于Emacs使用\s\S表示語(yǔ)法類甸各,所以就不能像Perl和Python一樣來(lái)表示空格和非空格。因此焰坪,Emacs中空格表示為\s-趣倾,非空格表示為\S-

字符類

字符類類似于語(yǔ)法類某饰,但以\c\C打頭表示是或否儒恋。這類似于Perl中的Unicode屬性\p{}\P{}

例如黔漂,\cg代表任意希臘字母诫尽,\Cg表示任意非希臘字母∥练拢可以通過(guò)運(yùn)行M-x describe-categories查看更多字符類的信息箱锐。

Python和Perl中有,而Emacs沒(méi)有的特性

Perl和Python都可以使用(?aimsx)對(duì)正則表達(dá)式進(jìn)行修改劳较。例如驹止,(?i)可使正則不區(qū)分大小寫。
也可以使用(?#...)引入注釋观蜗。

Perl和Python使用相同的語(yǔ)法進(jìn)行正向或反向查找:(?=), (?!), (?<=),和(?<!)臊恋。

Perl和Python都支持錨點(diǎn)\A\Z,以及\d, \D, \s\S墓捻。

這兩種語(yǔ)言都使用(?P<name>)?P=name)來(lái)命名和引用一個(gè)capture抖仅。Perl亦有其自己的語(yǔ)法。

Perl中有砖第,Python中沒(méi)有的特性

Perl正則相比于Python撤卢,其擁有的最大特點(diǎn)是Unicode字符類。(即這篇文章撰寫時(shí)梧兼,Python的remodule還不支持的放吩。)使用\p{}\P{}表示該類及其否定。

Perl中的\X是Unicode中.的變體羽杰,Programming Perl這樣描述它:

\X可以匹配一個(gè)用戶可見(jiàn)的字符(grapheme)渡紫,即使這需要幾個(gè)程序員可見(jiàn)的字符(code-points)才能匹配到推。

Perl還有的一些特征是,用\Q\E來(lái)引用惕澎,用\l\u表示大小寫莉测,用\L\U表示小寫或大寫的字符序列,用\E來(lái)結(jié)束唧喉。

Perl的正則表達(dá)式還有很多特性沒(méi)有一一列出拳恋。

更多資源請(qǐng)見(jiàn):

PowerShell和Perl中的正則表達(dá)式

Python中的正則表達(dá)式

R中的正則表達(dá)式

Mathematica中的正則表達(dá)式

C++ TR1正則表達(dá)式

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末试和,一起剝皮案震驚了整個(gè)濱河市绘梦,隨后出現(xiàn)的幾起案子抓于,更是在濱河造成了極大的恐慌赖瞒,老刑警劉巖倦炒,帶你破解...
    沈念sama閱讀 218,284評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件暖夭,死亡現(xiàn)場(chǎng)離奇詭異箩祥,居然都是意外死亡锈锤,警方通過(guò)查閱死者的電腦和手機(jī)驯鳖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)久免,“玉大人浅辙,你說(shuō)我怎么就攤上這事⊙掷眩” “怎么了记舆?”我有些...
    開(kāi)封第一講書人閱讀 164,614評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)呼巴。 經(jīng)常有香客問(wèn)我泽腮,道長(zhǎng),這世上最難降的妖魔是什么衣赶? 我笑而不...
    開(kāi)封第一講書人閱讀 58,671評(píng)論 1 293
  • 正文 為了忘掉前任诊赊,我火速辦了婚禮,結(jié)果婚禮上府瞄,老公的妹妹穿的比我還像新娘碧磅。我一直安慰自己,他們只是感情好遵馆,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,699評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布鲸郊。 她就那樣靜靜地躺著,像睡著了一般货邓。 火紅的嫁衣襯著肌膚如雪秆撮。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 51,562評(píng)論 1 305
  • 那天逻恐,我揣著相機(jī)與錄音像吻,去河邊找鬼峻黍。 笑死,一個(gè)胖子當(dāng)著我的面吹牛拨匆,可吹牛的內(nèi)容都是我干的姆涩。 我是一名探鬼主播,決...
    沈念sama閱讀 40,309評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼惭每,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼骨饿!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起台腥,我...
    開(kāi)封第一講書人閱讀 39,223評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤宏赘,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后黎侈,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體察署,經(jīng)...
    沈念sama閱讀 45,668評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,859評(píng)論 3 336
  • 正文 我和宋清朗相戀三年峻汉,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了贴汪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,981評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡休吠,死狀恐怖扳埂,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情瘤礁,我是刑警寧澤阳懂,帶...
    沈念sama閱讀 35,705評(píng)論 5 347
  • 正文 年R本政府宣布,位于F島的核電站柜思,受9級(jí)特大地震影響岩调,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜酝蜒,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,310評(píng)論 3 330
  • 文/蒙蒙 一誊辉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧亡脑,春花似錦堕澄、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,904評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至途戒,卻和暖如春坑傅,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背喷斋。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,023評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工唁毒, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蒜茴,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,146評(píng)論 3 370
  • 正文 我出身青樓浆西,卻偏偏與公主長(zhǎng)得像粉私,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子近零,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,933評(píng)論 2 355