今天剛拿出代碼之美好好觀賞一下于颖,第一篇就讓我眼前一亮,竟然是介紹關(guān)于正則表達(dá)式的消请,之前自己也自學(xué)過一段這個栏笆,但是那時候可能是自己還沒有到這個水平吧,看了挺久的臊泰,越看越暈 蛉加,感覺是正則表達(dá)式真的不是人用的啊8滋印U爰ⅰ!于是就沒有然后了~
今天看到幾十年前的一位計(jì)算機(jī)大師Rob Pike因?yàn)橄胱屨齽t表達(dá)式的使用更加方便一點(diǎn)需频,而不是需要各種巨大的package丁眼,就自己當(dāng)場手?jǐn)]了30行左右的C代碼,就解決了95%正則表達(dá)式的內(nèi)容昭殉。但是就覺得相見恨晚啊苞七,必須的好好學(xué)習(xí)一下。下面是代碼挪丢。
/* match: search for regexp anywhere in text */
int match(char *regexp, char *text)
{
if (regexp[0] == '^')
return matchhere(regexp+1, text);
do { /* must look even if string is empty */
if (matchhere(regexp, text))
return 1;
} while (*text++ != '\0');
return 0;
}
/* matchhere: search for regexp at beginning of text */
int matchhere(char *regexp, char *text)
{
if (regexp[0] == '\0')
return 1;
if (regexp[1] == '*')
return matchstar(regexp[0], regexp+2, text);
if (regexp[0] == '$' && regexp[1] == '\0')
return *text == '\0';
if (*text!='\0' && (regexp[0]=='.' || regexp[0]==*text))
return matchhere(regexp+1, text+1);
return 0;
}
/* matchstar: search for c*regexp at beginning of text */
int matchstar(int c, char *regexp, char *text)
{
do { /* a * matches zero or more instances */
if (matchhere(regexp, text))
return 1;
} while (*text != '\0' && (*text++ == c || c == '.'));
return 0;
}
這是基本的搜索規(guī)則:
Character | Meaning |
---|---|
c | Matches any literal character c . |
. (period) | Matches any single character. |
^ | Matches the beginning of the input string. |
$ | Matches the end of the input string. |
* | Matches zero or more occurrences of the previous character. |
只能說是致敬大師了蹂风,一個程序充分體現(xiàn)了C語言指針的力量和遞歸的魅力~