2019-08-13

本文來自：https://github.com/ziishaned/learn-regex/blob/master/translations/README-cn.md

什么是正則表達式?

正則表達式是一組由字母和符號組成的特殊文本, 它可以用來從文本中找出滿足你想要的格式的句子.

一個正則表達式是在一個主體字符串中從左到右匹配字符串時的一種樣式.
"Regular expression"這個詞比較拗口, 我們常使用縮寫的術(shù)語"regex"或"regexp".
正則表達式可以從一個基礎(chǔ)字符串中根據(jù)一定的匹配模式替換文本中的字符串堪遂、驗證表單也祠、提取字符串等等.

想象你正在寫一個應用, 然后你想設(shè)定一個用戶命名的規(guī)則, 讓用戶名包含字符,數(shù)字,下劃線和連字符,以及限制字符的個數(shù),好讓名字看起來沒那么丑.
我們使用以下正則表達式來驗證一個用戶名:

表達式

以上的正則表達式可以接受 john_doe, jo-hn_doe, john12_as.
但不匹配Jo, 因為它包含了大寫的字母而且太短了.

元字符	描述
.	句號匹配任意單個字符除了換行符.
[ ]	字符種類. 匹配方括號內(nèi)的任意字符.
[^ ]	否定的字符種類. 匹配除了方括號里的任意字符
*	匹配>=0個重復的在*號之前的字符.
+	匹配>=1個重復的+號前的字符.
?	標記?之前的字符為可選.
{n,m}	匹配num個大括號之前的字符 (n <= num <= m).
(xyz)	字符集, 匹配與 xyz 完全相等的字符串.
\|	或運算符,匹配符號前或后的字符.
\	轉(zhuǎn)義字符,用于匹配一些保留的字符 <code>[ ] ( ) { } . * + ? ^ $ \ \|</code>
^	從開始行開始匹配.
$	從末端開始匹配.

2.1 點運算符 `.`

.是元字符中最簡單的例子.
.匹配任意單個字符, 但不匹配換行符.
例如, 表達式.ar匹配一個任意字符后面跟著是a和r的字符串.

簡寫	描述
.	除換行符外的所有字符
\w	匹配所有字母數(shù)字, 等同于 `[a-zA-Z0-9_]`
\W	匹配所有非字母數(shù)字, 即符號, 等同于: `[^\w]`
\d	匹配數(shù)字: `[0-9]`
\D	匹配非數(shù)字: `[^\d]`
\s	匹配所有空格字符, 等同于: `[\t\n\f\r\p{Z}]`
\S	匹配所有非空格字符: `[^\s]`
\f	匹配一個換頁符
\n	匹配一個換行符
\r	匹配一個回車符
\t	匹配一個制表符
\v	匹配一個垂直制表符
\p	匹配 CR/LF (等同于 `\r\n`)怯屉，用來匹配 DOS 行終止符

符號	描述
?=	正先行斷言-存在
?!	負先行斷言-排除
?<=	正后發(fā)斷言-存在
?<!	負后發(fā)斷言-排除

標志	描述
i	忽略大小寫.
g	全局搜索.
m	多行的: 錨點元字符 `^` `$` 工作范圍在每行的起始.

2019-08-13

什么是正則表達式?

目錄

1. 基本匹配

2. 元字符

2.1 點運算符 .

2.2 字符集

2.2.1 否定字符集

2.3 重復次數(shù)

2.3.1 * 號

2.3.2 + 號

2.3.3 ? 號

2.4 {} 號

2.5 (...) 特征標群

2.6 | 或運算符

2.7 轉(zhuǎn)碼特殊字符

2.8 錨點

2.8.1 ^ 號

2.8.2 $ 號

3. 簡寫字符集

4. 零寬度斷言(前后預查)

4.1 ?=... 正先行斷言

4.2 ?!... 負先行斷言

4.3 ?<= ... 正后發(fā)斷言

4.4 ?<!... 負后發(fā)斷言

5. 標志

5.1 忽略大小寫 (Case Insensitive)

5.2 全局搜索 (Global search)

5.3 多行修飾符 (Multiline)

6. 貪婪匹配與惰性匹配 (Greedy vs lazy matching)

推薦閱讀更多精彩內(nèi)容

2.1 點運算符 `.`

2.3.1 `*` 號

2.3.2 `+` 號

2.3.3 `?` 號

2.4 `{}` 號

2.5 `(...)` 特征標群

2.6 `|` 或運算符

2.8.1 `^` 號

2.8.2 `$` 號

4.1 `?=...` 正先行斷言

4.2 `?!...` 負先行斷言

4.3 `?<= ...` 正后發(fā)斷言

4.4 `?<!...` 負后發(fā)斷言