字符串函數(shù):用戶的密碼毕谴、電子郵箱地址、證件號碼等都是以字符串類型保存在數(shù)據(jù)庫中的泡垃。
計(jì)算字符串長度
LENGTH()函數(shù)用來計(jì)算一個(gè)字符串的長度析珊。該函數(shù)接受一個(gè)參數(shù)羡鸥,此參數(shù)為待計(jì)算的字符串表達(dá)式蔑穴,在MYSQLServer 中這個(gè)函數(shù)名稱為LEN()。
如:
MYSQL,Oracle,DB2:
SELECT FName, LENGTH(FName) FROM T_Person
MSSQLServer:
SELECT FName, LEN(FName) FROM T_Person
字符串轉(zhuǎn)換為小寫
LOWER()函數(shù)用來將一個(gè)字符串轉(zhuǎn)換為小寫惧浴。該函數(shù)接受一個(gè)參數(shù)存和,此參數(shù)為待轉(zhuǎn)換的字符串表達(dá)式,在DB2 中這個(gè)函數(shù)名稱為LCASE()衷旅。如下SQL語句:
MYSQL,MSSQLServer,Oracle:
SELECT FName, LOWER(FName) FROM T_Person
DB2:
SELECT FName, LCASE(FName) FROM T_Person
字符串轉(zhuǎn)換為大寫
UPPER()函數(shù)用來將一個(gè)字符串轉(zhuǎn)換為大寫捐腿。該函數(shù)接受一個(gè)參數(shù),此參數(shù)為待轉(zhuǎn)換的字符串表達(dá)式柿顶,在DB2中這個(gè)函數(shù)名稱為UCASE ()茄袖。如下面SQL語句:
MYSQL,MSSQLServer,Oracle:
SELECT FName, UPPER(FName) FROM T_Person
DB2:
SELECT FName, UCASE(FName) FROM T_Person
截去字符串左側(cè)空格
LTRIM()函數(shù)用來將一個(gè)字符串左側(cè)的空格去掉。該函數(shù)接受一個(gè)參數(shù)嘁锯,此參數(shù)為待處理的字符串表達(dá)式宪祥。如下的SQL語句:
SELECT FName,LTRIM(FName),LTRIM("abc") FROM T_Person
截去字符串右側(cè)空格
RTRIM ()函數(shù)用來將一個(gè)字符串左側(cè)的空格去掉。該函數(shù)接受一個(gè)參數(shù)家乘,此參數(shù)為待處理的字符串表達(dá)式蝗羊。如下的SQL語句:
SELECT FName,RTRIM(FName),RTRIM("abc") FROM T_Person
截去字符串兩側(cè)的空格
TRIM ()函數(shù)用來將一個(gè)字符串兩側(cè)的空格去掉。該函數(shù)接受一個(gè)參數(shù)仁锯,此參數(shù)為待處理的字符串表達(dá)式耀找。此函數(shù)只在MYSQL 和Oracle 中提供支持,在MSSQLServer和DB2中可以使用LTRIM()函數(shù)和RTRIM()函數(shù)復(fù)合來進(jìn)行變通實(shí)現(xiàn)业崖,也就是用LTRIM(RTRIM(string))來模擬實(shí)現(xiàn)TRIM (string)野芒。
如:
MYSQL,Oracle:
SELECT FName,TRIM(FName),TRIM(" abc ") FROM T_Person
MSSQLServer,DB2:
SELECT FName,LTRIM(RTRIM(FName)),LTRIM(RTRIM(" abc ")) FROM T_Person
取子字符串
字符串是由多個(gè)字符組成的串,比如“HelloWorld”在內(nèi)存是如下存儲的:
1 2 3 4 5 6 7 8 9 10
H e l l o W o r l d
表格第一行的數(shù)字表示組成字符串的每個(gè)字符的位置双炕,第二行則為各個(gè)位置上的字符复罐。由這些字符中連續(xù)的多個(gè)字符還可以組成新的字符串,新的字符串則被稱為“子字符串”雄家。
如:從第3 個(gè)字符到第5 個(gè)字符組成的“l(fā)lo”就是一個(gè)子字符串效诅,我們也可以稱“l(fā)lo”為從第3 個(gè)字符開始長度為3 的子字符串胀滚。
計(jì)算子字符串的函數(shù)SUBSTRING(),其參數(shù)格式如下:
SUBSTRING(string,start_position,length)
其中參數(shù)string為主字符串乱投,start_position為子字符串在主字符串中的起始位置咽笼,length為子字符串的最大長度。
在MYSQL和MSSQLServer 中支持這個(gè)函數(shù)戚炫,在Oracle和DB2中這個(gè)函數(shù)的名稱為SUBSTR()
如下的SQL語句:
MYSQL剑刑、MSSQLServer:
SELECT SUBSTRING("abcdef111",2,3)
Oracle:
SELECT SUBSTR("abcdef111",2,3) FROM DUAL
DB2:
SELECT SUBSTR("abcdef111",2,3) FROM SYSIBM.SYSDUMMY1
執(zhí)行結(jié)果:
SUBSTRING("abcdef111",2,3)
bcd
再如下的SQL語句:
MYSQL,MSSQLServer:
SELECT FName, SUBSTRING(FName,2,3) FROM T_Person
Oracle,DB2:
SELECT FName, SUBSTR(FName,2,3) FROM T_Person
執(zhí)行結(jié)果:
FName SUBSTRING(FName,2,3)
Tom om
Jim im
Lily ily
Kelly ell
Sam am
Kerry err
Smith mit
BillGates ill
計(jì)算子字符串的位置
用于檢測制定的子字符串是否存在于主字符串中,如果存在則還可以返回所在的位置双肤。該函數(shù)在MYSQL 和Oracle中名稱為INSTR施掏,其參數(shù)格式如下:
INSTR(string,substring)
其中參數(shù)string為主字符串,參數(shù)substring為待查詢的子字符串茅糜。如果string中存在substring子字符串七芭,則返回子字符串第一個(gè)字符在主字符串中出現(xiàn)的位置;如果string中不存在substring子字符串蔑赘,則返回0狸驳。
在MSSQLServer中這個(gè)函數(shù)名為CHARINDEX,其參數(shù)格式以及返回值規(guī)則與MYSQL以及Oracle一致缩赛。
在DB2中這個(gè)函數(shù)名為LOCATE耙箍,其返回值規(guī)則與前述幾種數(shù)據(jù)庫系統(tǒng)一致,不過參數(shù)格式與它們正好相反酥馍,其參數(shù)格式如下:
LOCATE(substring,string)
其中參數(shù)substring為待查詢的子字符串,參數(shù)string為主字符串辩昆,也就是兩個(gè)參數(shù)的位置是與其它集中數(shù)據(jù)庫系統(tǒng)相反的。如下的SQL語句:
MYSQL,Oracle:
SELECT FName, INSTR(FName,"m") , INSTR(FName,"ly") FROM T_Person
MSSQLServer:
SELECT FName,CHARINDEX(FName,"m"), CHARINDEX(FName,"ly") FROM T_Person
DB2:
SELECT FName, LOCATE("m",FName) , LOCATE("ly",FName) FROT_Person
從左側(cè)開始取子字符串
使用SUBSTRING()函數(shù):從任意位置開始取任意長度的子字符串旨袒,不過有的時(shí)候我們只需要從左側(cè)開始取子字符串汁针,這樣指定主字符串和要取的長度就可以了,不過如果使用SUBSTRING()函數(shù)的話仍然需要指定三個(gè)參數(shù)峦失,其中第二個(gè)參數(shù)為常量1扇丛。MYSQL、MSSQLServer尉辑、DB2 中提供了LEFT()函數(shù)用于從左側(cè)開始取任意長度的子字符串帆精,其參數(shù)格式如下:
LEFT (string,length)
其中參數(shù)string為主字符串,length為子字符串的最大長度隧魄。
Oracle 不支持LEFT()函數(shù)卓练,但能使用SUBSTR()函數(shù)進(jìn)行變通實(shí)現(xiàn),即:SUBSTR(string, 1, length)购啄。
如下的SQL語句:
MYSQL,MSSQLServer,DB2:
SELECT FName, LEFT(FName,3) , LEFT(FName,2) FROM T_Person
Oracle:
SELECT FName,SUBSTR(FName, 1,3),SUBSTR(FName, 1,2) FROM T_Person
從右側(cè)開始取子字符串
SUBSTRING()函數(shù):從任意位置開始取任意長度的子字符串襟企,不過有的時(shí)候我們只需要從右側(cè)開始取子字符串,這樣指定主字符串和要取的長度就可以了狮含,不過如果使用SUBSTRING()函數(shù)的話仍然需要指定三個(gè)參數(shù)顽悼。
MYSQL曼振、MSSQLServer、DB2 中提供了RIGHT ()函數(shù):用于從左側(cè)開始取任意長度的子字符串蔚龙,其參數(shù)格式如下:
RIGHT (string,length)
其中參數(shù)string為主字符串冰评,length為子字符串的最大長度。
Oracle中不支持RIGHT ()函數(shù)木羹,只能使用SUBSTR()函數(shù)進(jìn)行變通實(shí)現(xiàn)甲雅,其中起始位置用如下表達(dá)式計(jì)算出來:startposition= LENGTH(string)- length+1
注:SUBSTR(string, LENGTH(string)- length+1, length)等價(jià)于RIGHT (string,length)。
執(zhí)行下面的SQL語句:
MYSQL,MSSQLServer,DB2:
SELECT FName, RIGHT(FName,3) , RIGHT(FName,2) FROM T_Person
Oracle:
SELECT FName,SUBSTR(FName, LENGTH(FName)-3 +1, 3),SUBSTR(FName, LENGTH(FName)-2 +1, 2) FROM T_Person
字符串替換
REPLACE()函數(shù):用來將字符串的指定的子字符串替換為其它的字符串坑填。
如:
將“Hello World”中的“rl”替換為“ok”后得到“Hello Wookd”
把“Just so so”中的“s”替換為“z”后得到“Juzt zo zo”
REPLACE()函數(shù)的參數(shù)格式如下:
REPLACE(string,string_tobe_replace,string_to_replace)
其中參數(shù)string為要進(jìn)行替換操作的主字符串抛人,參數(shù)string_tobe_replace為要被替換的字符串,而string_to_replace將替換string_tobe_replace中所有出現(xiàn)的地方脐瑰。如下的SQL語句:
select FName,REPLACE(FName,"i","e"),
FIDNumber,REPLACE(FIDNumber,"2345","abcd") FROM T_Person
SQL中沒提供刪除字符串中匹配的子字符串的方法妖枚,但使用REPLACE()函數(shù)就可以達(dá)到刪除子字符串的方法,即:將第三個(gè)參數(shù)設(shè)定為空字符串蚪黑,用空字符串來替換匹配的子字符串盅惜,就能達(dá)到了刪除指定子字符串的效果
如:將FName中的m以及FIDNumber 中的123 刪除
SELECT FName, REPLACE(FName,"m","") ,FIDNumber,
REPLACE(FIDNumber,"123","") FROM T_Person
LTRIM()中剩、RTRIM()和TRIM()都只能刪除兩側(cè)的字符串忌穿,無法刪除字符串中間的空格,而使用REPLACE()函數(shù)也可以完成這個(gè)功能结啼,也就是用空字符串替換中所有的空格掠剑。執(zhí)行下面的SQL語句:
MYSQL、MSSQLServer:
SELECT REPLACE(" abc 123 wpf"," ",""),REPLACE(" ccw enet wcf f"," ","")
Oracle:
SELECT REPLACE(" abc 123 wpf"," ",""),REPLACE(" ccw enet wcf f"," ","") FROM DUAL
DB2:
SELECT REPLACE(" abc 123 wpf"," ",""),REPLACE(" ccw enet wcf f"," ","") FROM SYSIBM.SYSDUMMY1
得到字符的ASCII碼
ASCII()函數(shù)用來得到一個(gè)字符的ASCII碼郊愧,它有且只有一個(gè)參數(shù)朴译,該參數(shù)為待求ASCII碼的字符,若參數(shù)為一個(gè)字符串則函數(shù)返回第一個(gè)字符的ASCII碼属铁,如:
MYSQL,MSSQLServer:
SELECT ASCII("a") , ASCII("abc")
Oracle:
SELECT ASCII("a") , ASCII("abc") FROM DUAL
DB2:
SELECT ASCII("a") , ASCII("abc") FROM SYSIBM.SYSDUMMY1
執(zhí)行結(jié)果:
ASCII("a") ASCII("abc")
97 97
再如:計(jì)算每個(gè)員工姓名的第一個(gè)字符的ASCII碼:
MYSQL,MSSQLServer,DB2:
SELECT FName, LEFT(FName,1),ASCII(LEFT(FName,1)),
ASCII(FName) FROM T_Person
Oracle:
SELECT FName,SUBSTR(FName,1,1),
ASCII(SUBSTR(FName, 1,1)),ASCII(FName) FROM T_Person
得到一個(gè)ASCII碼數(shù)字對應(yīng)的字符
與 ASCII()函數(shù)正好相反眠寿,該函數(shù)用來得到一個(gè)字符的ASCII 碼的函數(shù)。
在MYSQL焦蘑、MSSQLServer 和DB2 中該函數(shù)為:CHAR()盯拱,在Oracle中該函數(shù)的名字則為CHR()
執(zhí)行下面的SQL語句:
MYSQL,MSSQLServer:
SELECT CHAR(56),CHAR(90),"a",CHAR(ASCII("a"))
Oracle:
SELECT CHR(56),CHR(90),"a",CHR(ASCII("a")) FROM DUAL
DB2:
SELECT CHR(56),CHR(90),"a",CHR( ASCII("a")) FROM SYSIBM.SYSDUMMY1
執(zhí)行結(jié)果:
CHAR(56) CHAR(90) a CHAR( ASCII("a") )
8 Z a a
如:將FWeight轉(zhuǎn)換為整數(shù),得到它對應(yīng)的字符:
MYSQL例嘱、MSSQLServer:
SELECT FWeight, CEILING(FWeight),CHAR( CEILING(FWeight) ) FROM T_Person
Oracle:
SELECT FWeight, CEIL(FWeight),CHAR( CEIL(FWeight) ) FROM T_Person
DB2:
SELECT FWeight, CEILING(FWeight),CHAR(int(CEILING(FWeight))) FROM T_Person
由于DB2 的類型檢查機(jī)制非常嚴(yán)格狡逢,所以在DB2 中需要用int()函數(shù)將CEILING()函數(shù)的返回值顯示的轉(zhuǎn)換為整數(shù)類型。
發(fā)音匹配度
到目前為止所有關(guān)于字符串的匹配都是針對其拼寫形式的拼卵。
如:檢索年齡為“jack”的員工:
[code=java]
SELECT * from T_Person WHERE FName="jack"
[/code]
有時(shí)我們不知道一個(gè)人姓名的準(zhǔn)確拼寫奢浑,只知道它的發(fā)音,如“檢索名字發(fā)音為和[jeck]類似的人員”腋腮,就要進(jìn)行發(fā)音的匹配度測試
SOUNDEX()函數(shù):用于計(jì)算一個(gè)字符串的發(fā)音特征值雀彼,這個(gè)特征值為一個(gè)四個(gè)字符的字符串壤蚜,特征值的第一個(gè)字符總是初始字符串中的第一個(gè)字符,而其后則是一個(gè)三位數(shù)字的數(shù)值徊哑。
如:查詢幾個(gè)名字的發(fā)音特征值:
MYSQL,MSSQLServer:
SELECT SOUNDEX("jack"),SOUNDEX("jeck"),
SOUNDEX("joke"),SOUNDEX("juke"),
SOUNDEX("look"),SOUNDEX("jobe")
Oracle:
SELECT SOUNDEX("jack"),SOUNDEX("jeck"),
SOUNDEX("joke"),SOUNDEX("juke"),
SOUNDEX("look"),SOUNDEX("jobe") FROM DUAL
DB2:
SELECT SOUNDEX("jack"),SOUNDEX("jeck"),
SOUNDEX("joke"),SOUNDEX("juke"),
SOUNDEX("look"),SOUNDEX("jobe") FROM SYSIBM.SYSDUMMY1
執(zhí)行結(jié)果:
SOUNDEX("jack")
SOUNDEX("jeck")
SOUNDEX("joke")
SOUNDEX("juke")
SOUNDEX("look")
SOUNDEX("jobe")
J000 J000 J000 J000 L200 J100
可以看到j(luò)ack仍律、jeck、joke实柠、juke 幾個(gè)字符串的發(fā)音非常相似水泉,而look、jobe 的發(fā)音則和它們差距比較大窒盐。
再如:查詢公司所有員工姓名的發(fā)音特征值:
SELECT FName, SOUNDEX(FName) FROM T_Person
執(zhí)行結(jié)果:
FName SOUNDEX(FName)
Tom T500
Jim J500
Lily L000
Kelly K400
Sam S500
Kerry K600
Smith S530
BillGates B4232
在MSSQLServer和DB2中提供了DIFFERENCE()用來簡化兩個(gè)字符串的發(fā)音相似度比較草则,它可以計(jì)算兩個(gè)字符串的發(fā)音特征值,并且比較它們蟹漓,然后返回一個(gè)0至4之間的一個(gè)值來反映兩個(gè)字符串的發(fā)音相似度炕横,這個(gè)值越大則表示兩個(gè)字符串發(fā)音思想度越大。
如:計(jì)算每個(gè)人的姓名發(fā)音與“Merry”的相似度:
SELECT DIFFERENCE(FName,"Merry") FROM T_Person
執(zhí)行結(jié)果:
FName
Tom Merry 2
Jim Merry 1
Lily Merry 2
Kelly Merry 3
Sam Merry 2
Kerry Merry 3
Smith Merry 0
BillGates Merry 1
可以看到Kerry葡粒、Kelly與Merry的發(fā)音相似度非常高份殿。
在WHERE語句中使用DIFFERENCE()更有意義
如:查詢和“Tim”發(fā)音相似度大于3 的員工:
SELECT * FROM T_Person WHERE DIFFERENCE(FName,"Tim")>=3