select province_name,regexp_extract(province_name,'(.+)(市)',1)
from areas limit 10;
+----------------+------+--+
| province_name | _c1 |
+----------------+------+--+
| 北京市 | 北京 |
| 北京市 | 北京 |
函數(shù)描述:
regexp_extract(str, regexp[, idx]) - extracts a group that matches regexp
字符串正則表達(dá)式解析函數(shù)较沪。-- 這個(gè)函數(shù)有點(diǎn)類似于 substring(str from 'regexp') ..
參數(shù)解釋:
其中:
str是被解析的字符串
regexp 是正則表達(dá)式
idx是返回結(jié)果 取表達(dá)式的哪一部分 默認(rèn)值為1。
0表示把整個(gè)正則表達(dá)式對應(yīng)的結(jié)果全部返回
1表示返回正則表達(dá)式中第一個(gè)() 對應(yīng)的結(jié)果 以此類推
注意點(diǎn):
要注意的是idx的數(shù)字不能大于表達(dá)式中()的個(gè)數(shù)椎工。
否則報(bào)錯(cuò)。
完