2020年11月13日 星期五

【Regular】常用的正規表示式

檢核欄位的時候,很常用到,雖然也Bookmark不少相關的文,但是,不少都關了,為了避免每次都要再費事找搜尋,索性留個筆記!





*台灣人常用的

主流信用卡 /^(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|6011[0-9]{12}|622((12[6-9]|1[3-9][0-9])|([2-8][0-9][0-9])|(9(([0-1][0-9])|(2[0-5]))))[0-9]{10}|64[4-9][0-9]{13}|65[0-9]{14}|3(?:0[0-5]|[68][0-9])[0-9]{11}|3[47][0-9]{13})*$/

美國運通信用卡 /^(3[47][0-9]{13})*$/

MasterCard /^(5[1-5][0-9]{14})*$/

Visa 卡 /^(4[0-9]{12}(?:[0-9]{3})?)*$/

日期 (MM/DD/YYYY) /^((0?[1-9]|1[012])[- /.](0?[1-9]|[12][0-9]|3[01])[- /.](19|20)?[0-9]{2})*$/

日期 (YYYY/MM/DD) /^(((?:19|20)[0-9]{2})[- /.](0?[1-9]|1[012])[- /.](0?[1-9]|[12][0-9]|3[01]))*$/

電子郵件 以下的範例並沒有相容 RFC5322 規範,但是已經可以驗證大多數的電子郵件。 /^([a-zA-Z0-9._%-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,4})*$/

IPv4 /^((?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?))*$/

密碼 高強度密碼,6 位數以上,並且至少包含 大寫字母、小寫字母、數字、符號 各一 /^(?=.*[^a-zA-Z0-9])(?=.*[A-Z])(?=.*[a-z])(?=.*\d).{6,}$/

台灣手機號碼 /^09\d{2}-?\d{3}-?\d{3}$/

URL 網址 允許 http, https, ftp 協定,並且可取出 Protocol, Domain, Path, Query /^(?:(https?|ftp):\/\/)?((?:[a-zA-Z0-9.\-]+\.)+(?:[a-zA-Z0-9]{2,4}))((?:/[\w+=%&.~\-]*)*)\??([\w+=%&.~\-]*)$/

取代重複行 搜尋:/^(.*)(\n\1)+$/ 取代:\1

中文 (Unicode) [\u4e00-\u9fa5]

刪除空白行 搜尋:/^\s*$/m 取代:

刪除行首行尾空白 搜尋:^\s*|\s*$ 取代:

驗證使用者帳號 第一個字不為數字,只接受 大小寫字母、數字及底線 /^[a-zA-Z]\w*$/

簡易驗證台灣身份證 仍然需要一些進階的檢查,如 驗證檢查碼,或前往 內政部戶政司 驗證 /^[A-Za-z][1-2]\d{8}$/

正整數 /^\+?\d+$/

整數 /^[+-]?\d+$/

float /^[-+]?[0-9]*\.?[0-9]+([eE][-+]?[0-9]+)?$/

*其他的

一、校驗數字的表達式

數字:^[0-9]*$

n位的數字:^\d{n}$

至少n位的數字:^\d{n,}$

m-n位的數字:^\d{m,n}$

零和非零開頭的數字:^(0|[1-9][0-9]*)$

非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(.[0-9]{1,2})?$

帶1-2位小數的正數或負數:^(\-)?\d+(\.\d{1,2})?$

正數、負數、和小數:^(\-|\+)?\d+(\.\d+)?$

有兩位小數的正實數:^[0-9]+(.[0-9]{2})?$

有1~3位小數的正實數:^[0-9]+(.[0-9]{1,3})?$

非零的正整數:^[1-9]\d*$^([1-9][0-9]*){1,3}$^\+?[1-9][0-9]*$

非零的負整數:^\-[1-9][]0-9″*$^-[1-9]\d*$

非負整數:^\d+$^[1-9]\d*|0$

非正整數:^-[1-9]\d*|0$^((-\d+)|(0+))$

非負浮點數:^\d+(\.\d+)?$^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$

非正浮點數:^((-\d+(\.\d+)?)|(0+(\.0+)?))$^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$

正浮點數:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$

負浮點數:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$

浮點數:^(-?\d+)(\.\d+)?$^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

二、校驗字符的表達式

漢字:^[\u4e00-\u9fa5]{0,}$

英文和數字:^[A-Za-z0-9]+$^[A-Za-z0-9]{4,40}$

長度為3-20的所有字符:^.{3,20}$

由26個英文字母組成的字符串:^[A-Za-z]+$

由26個大寫英文字母組成的字符串:^[A-Z]+$

由26個小寫英文字母組成的字符串:^[a-z]+$

由數字和26個英文字母組成的字符串:^[A-Za-z0-9]+$

由數字、26個英文字母或者下劃線組成的字符串:^\w+$^\w{3,20}$

中文、英文、數字包括下劃線:^[\u4E00-\u9FA5A-Za-z0-9_]+$

中文、英文、數字但不包括下劃線等符號:^[\u4E00-\u9FA5A-Za-z0-9]+$^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$

可以輸入含有^%&』,;=?$\」等字符:[^%&',;=?$\x22]+

禁止輸入含有~的字符:[^~\x22]+

三、特殊需求表達式

Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$

域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?

InternetURL:[a-zA-z]+://[^\s]*^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$

手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$

電話號碼(「XXX-XXXXXXX」、」XXXX-XXXXXXXX」、」XXX-XXXXXXX」、」XXX-XXXXXXXX」、」XXXXXXX」和」XXXXXXXX):^($$\d{3,4}-)|\d{3.4}-)?\d{7,8}$

國內電話號碼(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}

身份證號(15位、18位數字):^\d{15}|\d{18}$

短身份證號碼(數字、字母x結尾):^([0-9]){7,18}(x|X)?$^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$

帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$

密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-zA-Z]\w{5,17}$

強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字符,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$

日期格式:^\d{4}-\d{1,2}-\d{1,2}

一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$

一個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$

錢的輸入格式:

有四種錢的表示形式我們可以接受:」10000.00″ 和 「10,000.00″, 和沒有 「分」 的 「10000″ 和 「10,000″:^[1-9][0-9]*$

這表示任意一個不以0開頭的數字,但是,這也意味著一個字符」0″不通過,所以我們採用下面的形式:^(0|[1-9][0-9]*)$

一個0或者一個不以0開頭的數字.我們還可以允許開頭有一個負號:^(0|-?[1-9][0-9]*)$

這表示一個0或者一個可能為負的開頭不為0的數字.讓用戶以0開頭好了.把負號的也去掉,因為錢總不能是負的吧.下面我們要加的是說明可能的小數部分:^[0-9]+(.[0-9]+)?$

必須說明的是,小數點後面至少應該有1位數,所以」10.」是不通過的,但是 「10″ 和 「10.2″ 是通過的:^[0-9]+(.[0-9]{2})?$

這樣我們規定小數點後面必須有兩位,如果你認為太苛刻了,可以這樣:^[0-9]+(.[0-9]{1,2})?$

這樣就允許用戶只寫一位小數。下面我們該考慮數字中的逗號了,我們可以這樣:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$

1到3個數字,後面跟著任意個 逗號+3個數字,逗號成為可選,而不是必須:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$

備註:這就是最終結果了,別忘了」+」可以用」*」替代。如果你覺得空字符串也可以接受的話(奇怪,為什麼?)最後,別忘了在用函數時去掉去掉那個反斜槓,一般的錯誤都在這裡

xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$

中文字符的正則表達式:[\u4e00-\u9fa5]

雙字節字符:[^\x00-\xff] (包括漢字在內,可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1))

空白行的正則表達式:\n\s*\r (可以用來刪除空白行)

HTML標記的正則表達式:<(\S*?)[^>]*>.*?</\1>|<.*? /> (網上流傳的版本太糟糕,上面這個也僅僅能部分,對於複雜的嵌套標記依舊無能為力)

首尾空白字符的正則表達式:^\s*|\s*$(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式)

騰訊QQ號:[1-9][0-9]{4,} (騰訊QQ號從10000開始)

中國郵政編碼:[1-9]\d{5}(?!\d) (中國郵政編碼為6位數字)

IP位址:\d+\.\d+\.\d+\.\d+ (提取IP位址時有用)

IP位址:((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))

沒有留言:

張貼留言