01正则表达式

快捷手册_正则表达式

常用的元字符

代码

说明

.

匹配除换行符以外的任意字符

\w

匹配字母或数字或下划线或汉字

\s

匹配任意的空白符

\d

匹配数字

\b

匹配单词的开始或结束

^

匹配字符串的开始

$

匹配字符串的结束

常用的反义字符

代码/语法

说明

\W

匹配任意不是字母,数字,下划线,汉字的字符

\S

匹配任意不是空白符的字符

\D

匹配任意非数字的字符

\B

匹配不是单词开头或结束的位置

[^x]

匹配除了x以外的任意字符

[^aeiou]

匹配除了aeiou这几个字母以外的任意字符

常用的限定符

代码/语法

说明

*

重复零次或更多次

+

重复一次或更多次

?

重复零次或一次

{n}

重复n次

{n,}

重复n次或更多次

{n,m}

重复n到m次

懒惰限定符

代码/语法

说明

*?

重复任意次,但尽可能少重复

+?

重复1次或更多次,但尽可能少重复

??

重复0次或1次,但尽可能少重复

{n,m}?

重复n到m次,但尽可能少重复

{n,}?

重复n次以上,但尽可能少重复

常用的分组字符

分类

代码/语法

说明

捕获

(exp)

匹配exp,并捕获文本到自动命名的组里

捕获

(?exp)

匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)

捕获

(?:exp)

匹配exp,不捕获匹配的文本,也不给此分组分配组号

零宽断言

(?=exp)

匹配exp前面的位置

零宽断言

(?<=exp)

匹配exp后面的位置

零宽断言

(?!exp)

匹配后面跟的不是exp的位置

零宽断言

(?<!exp)

匹配前面不是exp的位置

注释

(?#comment)

这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读

常用案例

匹配身份证号码。身份证号为 18 位,前 17 位为数字,最后一位为数字或者大写字母 X。

^\d{17}([0-9]|X)$

匹配中国国内电话号码,形式如 0511-4405222 或 021-87888822。

`d{3}-d{8}|d{4}-d{7}`

匹配 Email 地址。

w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

匹配网址 URL。

[a-zA-z]+://[^\S]*`

匹配合法帐号。假设账号以字母开头,5-16 个字符,只允许字母数字下划线。

^[a-zA-Z][a-zA-Z0-9_]{4,15}$

匹配 IP 地址。IPv4 的地址的格式是(0~255).(0~255).(0~255).(0~255)。

^((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])\.){3}(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])$

匹配特定数字。

^[1-9]d*$            //匹配正整数 
^-[1-9]d*$           //匹配负整数 
^-?[1-9]d*$           //匹配整数 
^[1-9]d*|0$          //匹配非负整数(正整数+0) 
^-[1-9]d*|0$       //匹配非正整数(负整数+0) 
^[1-9]d*.d*|0.d*[1-9]d*$       //匹配正浮点数 
^-([1-9]d*.d*|0.d*[1-9]d*)$      //匹配负浮点数 
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$      //匹配浮点数 
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$       //匹配非负浮点数(正浮点数 + 0) 
^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮点数(负浮点数 + 0)

匹配空行。

windows: ^(\s*)\r\n
linux: ^(\s*)\n
mac: ^(\s*)\r

匹配任意字符串,包括不可打印字符。

[\s\S]+

//或
[\s\S]{1,}

参考

正则表达式30分钟入门教程:https://deerchao.cn/tutorials/regex/regex.htm

正则表达式快速入门:https://blog.csdn.net/k346k346/article/details/53184800

正则表达式入门:https://blog.csdn.net/weixin_38071135/article/details/82121398

Last updated