這里是幾個主要非英文語系字符范圍(google上找到的):
2E80~33FFh:中日韓符號區(qū)。收容康熙字典部首蛔糯、中日韓輔助部首、注音符號窖式、日本假名蚁飒、韓文音符,中日韓的符號脖镀、標(biāo)點(diǎn)飒箭、帶圈或帶括符文數(shù)字狼电、月份蜒灰,以及日本的假名組合弦蹂、單位、年號强窖、月份凸椿、日期、時間等翅溺。
3400~4DFFh:中日韓認(rèn)同表意文字?jǐn)U充A區(qū)脑漫,總計收容6,582個中日韓漢字。
4E00~9FFFh:中日韓認(rèn)同表意文字區(qū)咙崎,總計收容20,902個中日韓漢字优幸。
A000~A4FFh:彝族文字區(qū),收容中國南方彝族文字和字根褪猛。
AC00~D7FFh:韓文拼音組合字區(qū)网杆,收容以韓文音符拼成的文字。
F900~FAFFh:中日韓兼容表意文字區(qū)伊滋,總計收容302個中日韓漢字碳却。
FB00~FFFDh:文字表現(xiàn)形式區(qū),收容組合拉丁文字笑旺、希伯來文昼浦、阿拉伯文、中日韓直式標(biāo)點(diǎn)筒主、小符號关噪、半角符號、全角符號等乌妙。
比如需要匹配所有中日韓非符號字符,那么正則表達(dá)式應(yīng)該是^[/u3400-/u9FFF]+$
理論上沒錯, 可是我到msn.co.ko隨便復(fù)制了個韓文下來, 發(fā)現(xiàn)根本不對, 詭異
再到msn.co.jp復(fù)制了個'お', 也不得行..
然后把范圍擴(kuò)大到^[/u2E80-/u9FFF]+$, 這樣倒是都通過了, 這個應(yīng)該就是匹配中日韓文字的正則表達(dá)式了, 包括我們臺灣省還在盲目使用的繁體中文
而關(guān)于中文的正則表達(dá)式, 應(yīng)該是^[/u4E00-/u9FFF]+$, 和論壇里常被人提起的^[/u4E00-/u9FA5]+$很接近
需要注意的是論壇里說的^[/u4E00-/u9FA5]+$這是專門用于匹配簡體中文的正則表達(dá)式, 實(shí)際上繁體字也在里面, 我用測試器測試了下'中華人民共和國', 也通過了, 當(dāng)然, ^[/u4E00-/u9FFF]+$也是一樣的結(jié)果
匹配雙字節(jié)字符(包括漢字在內(nèi)):[^x00-xff]
評注:可以用來計算字符串的長度(一個雙字節(jié)字符長度計2色洞,ASCII字符計1)
匹配空白行的正則表達(dá)式:ns*r
評注:可以用來刪除空白行
匹配HTML標(biāo)記的正則表達(dá)式:<(S*?)[^>]*>.*?|<.*? />
評注:網(wǎng)上流傳的版本太糟糕,上面這個也僅僅能匹配部分冠胯,對于復(fù)雜的嵌套標(biāo)記依舊無能為力
匹配首尾空白字符的正則表達(dá)式:^s*|s*$
評注:可以用來刪除行首行尾的空白字符(包括空格火诸、制表符、換頁符等等)荠察,非常有用的表達(dá)式
匹配Email地址的正則表達(dá)式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
評注:表單驗(yàn)證時很實(shí)用
匹配網(wǎng)址URL的正則表達(dá)式:[a-zA-z]+://[^s]*
評注:網(wǎng)上流傳的版本功能很有限置蜀,上面這個基本可以滿足需求
匹配帳號是否合法(字母開頭,允許5-16字節(jié)悉盆,允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評注:表單驗(yàn)證時很實(shí)用
匹配國內(nèi)電話號碼:d{3}-d{8}|d{4}-d{7}
評注:匹配形式如 0511-4405222 或 021-87888822
匹配騰訊QQ號:[1-9][0-9]{4,}
評注:騰訊QQ號從10000開始
匹配中國郵政編碼:[1-9]d{5}(?!d)
評注:中國郵政編碼為6位數(shù)字
匹配身份證:d{15}|d{18}
評注:中國的身份證為15位或18位
匹配ip地址:d+.d+.d+.d+
評注:提取ip地址時有用
匹配特定數(shù)字:
^[1-9]d*$ //匹配正整數(shù)
^-[1-9]d*$ //匹配負(fù)整數(shù)
^-?[1-9]d*$ //匹配整數(shù)
^[1-9]d*|0$ //匹配非負(fù)整數(shù)(正整數(shù) + 0)
^-[1-9]d*|0$ //匹配非正整數(shù)(負(fù)整數(shù) + 0)
^[1-9]d*.d*|0.d*[1-9]d*$ //匹配正浮點(diǎn)數(shù)
^-([1-9]d*.d*|0.d*[1-9]d*)$ //匹配負(fù)浮點(diǎn)數(shù)
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$ //匹配浮點(diǎn)數(shù)
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$ //匹配非負(fù)浮點(diǎn)數(shù)(正浮點(diǎn)數(shù) + 0)
^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$ //匹配非正浮點(diǎn)數(shù)(負(fù)浮點(diǎn)數(shù) + 0)
評注:處理大量數(shù)據(jù)時有用盯荤,具體應(yīng)用時注意修正
匹配特定字符串:
^[A-Za-z]+$ //匹配由26個英文字母組成的字符串
^[A-Z]+$ //匹配由26個英文字母的大寫組成的字符串
^[a-z]+$ //匹配由26個英文字母的小寫組成的字符串
^[A-Za-z0-9]+$ //匹配由數(shù)字和26個英文字母組成的字符串
^w+$ //匹配由數(shù)字、26個英文字母或者下劃線組成的字符串
在使用RegularExpressionValidator驗(yàn)證控件時的驗(yàn)證功能及其驗(yàn)證表達(dá)式介紹如下:
只能輸入數(shù)字:“^[0-9]*$”
只能輸入n位的數(shù)字:“^d{n}$”
只能輸入至少n位數(shù)字:“^d{n,}$”
只能輸入m-n位的數(shù)字:“^d{m,n}$”
只能輸入零和非零開頭的數(shù)字:“^(0|[1-9][0-9]*)$”
只能輸入有兩位小數(shù)的正實(shí)數(shù):“^[0-9]+(.[0-9]{2})?$”
只能輸入有1-3位小數(shù)的正實(shí)數(shù):“^[0-9]+(.[0-9]{1,3})?$”
只能輸入非零的正整數(shù):“^+?[1-9][0-9]*$”
只能輸入非零的負(fù)整數(shù):“^-[1-9][0-9]*$”
只能輸入長度為3的字符:“^.{3}$”
只能輸入由26個英文字母組成的字符串:“^[A-Za-z]+$”
只能輸入由26個大寫英文字母組成的字符串:“^[A-Z]+$”
只能輸入由26個小寫英文字母組成的字符串:“^[a-z]+$”
只能輸入由數(shù)字和26個英文字母組成的字符串:“^[A-Za-z0-9]+$”
只能輸入由數(shù)字焕盟、26個英文字母或者下劃線組成的字符串:“^w+$”
驗(yàn)證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式為:以字母開頭秋秤,長度在6-18之間,
只能包含字符、數(shù)字和下劃線灼卢。
驗(yàn)證是否含有^%&',;=?$"等字符:“[^%&',;=?$x22]+”
只能輸入漢字:“^[u4e00-u9fa5],{0,}$”
驗(yàn)證Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”
驗(yàn)證InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”
驗(yàn)證電話號碼:“^((d{3,4})|d{3,4}-)?d{7,8}$”
正確格式為:“XXXX-XXXXXXX”绍哎,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”鞋真,
“XXX-XXXXXXXX”崇堰,“XXXXXXX”,“XXXXXXXX”涩咖。
驗(yàn)證身份證號(15位或18位數(shù)字):“^d{15}|d{}18$”
驗(yàn)證一年的12個月:“^(0?[1-9]|1[0-2])$”正確格式為:“01”-“09”和“1”“12”
驗(yàn)證一個月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”
正確格式為:“01”“09”和“1”“31”海诲。
匹配中文字符的正則表達(dá)式: [u4e00-u9fa5]
匹配雙字節(jié)字符(包括漢字在內(nèi)):[^x00-xff]
匹配空行的正則表達(dá)式:n[s| ]*r
匹配HTML標(biāo)記的正則表達(dá)式:/<(.*)>.*|<(.*) />/
匹配首尾空格的正則表達(dá)式:(^s*)|(s*$)
匹配Email地址的正則表達(dá)式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
匹配網(wǎng)址URL的正則表達(dá)式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?
(1)應(yīng)用:計算字符串的長度(一個雙字節(jié)字符長度計2,ASCII字符計1)
String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;}
(2)應(yīng)用:javascript中沒有像vbscript那樣的trim函數(shù)檩互,我們就可以利用這個表達(dá)式來實(shí)現(xiàn)
String.prototype.trim = function()
{
return this.replace(/(^s*)|(s*$)/g, "");
}
(3)應(yīng)用:利用正則表達(dá)式分解和轉(zhuǎn)換IP地址
function IP2V(ip) //IP地址轉(zhuǎn)換成對應(yīng)數(shù)值
{
re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正則表達(dá)式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}
(4)應(yīng)用:從URL地址中提取文件名的javascript程序
s="http://www.9499.net/page1.htm";
s=s.replace(/(.*/){0,}([^.]+).*/ig,"$2") ;//Page1.htm
(5)應(yīng)用:利用正則表達(dá)式限制網(wǎng)頁表單里的文本框輸入內(nèi)容
用正則表達(dá)式限制只能輸入中文:onkeyup="value=value.replace(/[^u4E00-u9FA5]/g,') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^u4E00-u9FA5]/g,'))"
用正則表達(dá)式限制只能輸入全角字符: onkeyup="value=value.replace(/[^uFF00-uFFFF]/g,') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^uFF00-uFFFF]/g,'))"
用正則表達(dá)式限制只能輸入數(shù)字:onkeyup="value=value.replace(/[^d]/g,') "onbeforepaste= "clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,'))"
用正則表達(dá)式限制只能輸入數(shù)字和英文:onkeyup="value=value.replace(/[W]/g,') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,'