1.視圖:
1)創(chuàng)建視圖:
CREATE OR REPLACE VIEW ods.speaktrain_teacher_homework_v
AS
select
a.name,
a.id
from speaktrain_0001_teacher_homework_ex a
2)刪除視圖:drop? view? ods.speaktrain_teacher_homework_v
2.分區(qū)
1)創(chuàng)建分區(qū)表:
create table rptdata.fact_speaktrain_upload_homework_detail(
? ? ? id? ? ? ? ? ? ? ? ? string,
? ? student_id? ? ? ? ? string,
? ? book_id? ? ? ? ? ? string,
? ? do_qst_num? ? ? ? ? string,
)partitioned BY (src_file_day string)
stored as parquet;
insert overwrite table rptdata.fact_speaktrain_upload_homework_detail PARTITION (src_file_day = "20180610")
3.正則表達(dá)式:
regexp_replace("IloveYou","You","") 結(jié)果為:Ilove
正則匹配函數(shù) regexp_extract
語(yǔ)法: ? ?regexp_extract(string?subject, ?string?pattern, ?int?index)
返回值:?string
說明: ?將字符串subject按照pattern正則表達(dá)式的規(guī)則拆分凰浮,返回index指定的字符励烦。
第一參數(shù): ? 要處理的字段
第二參數(shù): ? ?需要匹配的正則表達(dá)式
第三個(gè)參數(shù):
0是顯示與之匹配的整個(gè)字符串
1 是顯示第一個(gè)括號(hào)里面的
2 是顯示第二個(gè)括號(hào)里面的字段...
注意夭禽,在有些情況下要使用轉(zhuǎn)義字符(雙斜杠了‘\\’)城菊。
正則匹配字符解釋:
^ 表示開頭
$ 表示結(jié)尾
. 表示任意字符
* 表示任意多個(gè)
關(guān)于正則表達(dá)式的符號(hào)及意義:
/ ?? 做為轉(zhuǎn)義秘蛇,即通常在"/"后面的字符不按原來意義解釋其做,如/b/匹配字符"b",當(dāng)b前面加了反斜桿后//b/赁还,轉(zhuǎn)意為匹配一個(gè)單詞的邊界妖泄。
-或- 對(duì)正則表達(dá)式功能字符的還原,如"*"匹配它前面元字符0次或多次艘策,/a*/將匹配a,aa,aaa蹈胡,加了"/"后,/a/*/將只匹配"a*"。
^ 匹配一個(gè)輸入或一行的開頭罚渐,/^a/匹配"an A"却汉,而不匹配"An a"
$ 匹配一個(gè)輸入或一行的結(jié)尾,/a$/匹配"An a"荷并,而不匹配"an A"
* 匹配前面元字符0次或多次合砂,/ba*/將匹配b,ba,baa,baaa
+ 匹配前面元字符1次或多次,/ba*/將匹配ba,baa,baaa
? 匹配前面元字符0次或1次源织,/ba*/將匹配b,ba
(x) 匹配x保存x在名為$1...$9的變量中
x|y 匹配x或y
{n} 精確匹配n次
{n,} 匹配n次以上
{n,m} 匹配n-m次
[xyz] 字符集(character set)翩伪,匹配這個(gè)集合中的任一一個(gè)字符(或元字符)
[^xyz] 不匹配這個(gè)集合中的任何一個(gè)字符
[/b] 匹配一個(gè)退格符
/b 匹配一個(gè)單詞的邊界
/B 匹配一個(gè)單詞的非邊界
/cX 這兒,X是一個(gè)控制符谈息,//cM/匹配Ctrl-M
/d 匹配一個(gè)字?jǐn)?shù)字符缘屹,//d/ = /[0-9]/
/D 匹配一個(gè)非字?jǐn)?shù)字符,//D/ = /[^0-9]/
/n 匹配一個(gè)換行符
/r 匹配一個(gè)回車符
/s 匹配一個(gè)空白字符侠仇,包括/n,/r,/f,/t,/v等
/S 匹配一個(gè)非空白字符轻姿,等于/[^/n/f/r/t/v]/
/t 匹配一個(gè)制表符
/v 匹配一個(gè)重直制表符
/w 匹配一個(gè)可以組成單詞的字符(alphanumeric,這是我的意譯傅瞻,含數(shù)字)踢代,包括下劃線,如[/w]匹配"$5.98"中的5嗅骄,等于[a-zA-Z0-9]
/W 匹配一個(gè)不可以組成單詞的字符胳挎,如[/W]匹配"$5.98"中的$,等于[^a-zA-Z0-9]
'( )' 標(biāo)記一個(gè)子表達(dá)式的開始和結(jié)束位置溺森。
'[]' 標(biāo)記一個(gè)中括號(hào)表達(dá)式慕爬。
/num 匹配 num,其中 num 是一個(gè)正整數(shù)屏积。對(duì)所獲取的匹配的引用医窿。
字符簇:?
[[:alpha:]] 任何字母。
[[:digit:]] 任何數(shù)字炊林。
[[:alnum:]] 任何字母和數(shù)字姥卢。
[[:space:]] 任何白字符。
[[:upper:]] 任何大寫字母渣聚。
[[:lower:]] 任何小寫字母独榴。
[[:punct:]] 任何標(biāo)點(diǎn)符號(hào)。
[[:xdigit:]] 任何16進(jìn)制的數(shù)字奕枝,相當(dāng)于[0-9a-fA-F]
[[:<:]],[[:>:]]?標(biāo)記表示word邊界棺榔。它們分別與word的開始和結(jié)束匹配。word是一系列字字符隘道,其前面和后面均沒有字字符症歇。字字符是alnum類中的字母數(shù)字字符或下劃線(_)
各種操作符的運(yùn)算優(yōu)先級(jí):
/ 轉(zhuǎn)義符
(), (?:), (?=), [] 圓括號(hào)和方括號(hào)
*, +, ?, {n}, {n,}, {n,m} 限定符
^, $, anymetacharacter 位置和順序
例:
1)? select regexp_extract('hitdecisiondlist','(i)(.*?)(e)',0) ;
得到的結(jié)果為:
itde
2)??select regexp_extract('hitdecisiondlist','(i)(.*?)(e)',1) ;
得到的結(jié)果為:
i
3)??select regexp_extract('hitdecisiondlist','(i)(.*?)(e)',2) ;
得到的結(jié)果為:
td
4)? select regexp_extract('x=a3&x=18abc&x=2&y=3&x=4','x=([0-9]+)([a-z]+)',2) from default.dual;
得到的結(jié)果為:
abc