01正则表达式
快捷手册_正则表达式
常用的元字符
代码
说明
.
匹配除换行符以外的任意字符
\w
匹配字母或数字或下划线或汉字
\s
匹配任意的空白符
\d
匹配数字
\b
匹配单词的开始或结束
^
匹配字符串的开始
$
匹配字符串的结束
常用的反义字符
代码/语法
说明
\W
匹配任意不是字母,数字,下划线,汉字的字符
\S
匹配任意不是空白符的字符
\D
匹配任意非数字的字符
\B
匹配不是单词开头或结束的位置
[^x]
匹配除了x以外的任意字符
[^aeiou]
匹配除了aeiou这几个字母以外的任意字符
常用的限定符
代码/语法
说明
*
重复零次或更多次
+
重复一次或更多次
?
重复零次或一次
{n}
重复n次
{n,}
重复n次或更多次
{n,m}
重复n到m次
懒惰限定符
代码/语法
说明
*?
重复任意次,但尽可能少重复
+?
重复1次或更多次,但尽可能少重复
??
重复0次或1次,但尽可能少重复
{n,m}?
重复n到m次,但尽可能少重复
{n,}?
重复n次以上,但尽可能少重复
常用的分组字符
分类
代码/语法
说明
捕获
(exp)
匹配exp,并捕获文本到自动命名的组里
捕获
(?exp)
匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)
捕获
(?:exp)
匹配exp,不捕获匹配的文本,也不给此分组分配组号
零宽断言
(?=exp)
匹配exp前面的位置
零宽断言
(?<=exp)
匹配exp后面的位置
零宽断言
(?!exp)
匹配后面跟的不是exp的位置
零宽断言
(?<!exp)
匹配前面不是exp的位置
注释
(?#comment)
这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读
常用案例
匹配身份证号码。身份证号为 18 位,前 17 位为数字,最后一位为数字或者大写字母 X。
^\d{17}([0-9]|X)$
匹配中国国内电话号码,形式如 0511-4405222 或 021-87888822。
`d{3}-d{8}|d{4}-d{7}`
匹配 Email 地址。
w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
匹配网址 URL。
[a-zA-z]+://[^\S]*`
匹配合法帐号。假设账号以字母开头,5-16 个字符,只允许字母数字下划线。
^[a-zA-Z][a-zA-Z0-9_]{4,15}$
匹配 IP 地址。IPv4 的地址的格式是(0~255).(0~255).(0~255).(0~255)。
^((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])\.){3}(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])$
匹配特定数字。
^[1-9]d*$ //匹配正整数
^-[1-9]d*$ //匹配负整数
^-?[1-9]d*$ //匹配整数
^[1-9]d*|0$ //匹配非负整数(正整数+0)
^-[1-9]d*|0$ //匹配非正整数(负整数+0)
^[1-9]d*.d*|0.d*[1-9]d*$ //匹配正浮点数
^-([1-9]d*.d*|0.d*[1-9]d*)$ //匹配负浮点数
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$ //匹配浮点数
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$ //匹配非负浮点数(正浮点数 + 0)
^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$ //匹配非正浮点数(负浮点数 + 0)
匹配空行。
windows: ^(\s*)\r\n
linux: ^(\s*)\n
mac: ^(\s*)\r
匹配任意字符串,包括不可打印字符。
[\s\S]+
//或
[\s\S]{1,}
参考
正则表达式30分钟入门教程:https://deerchao.cn/tutorials/regex/regex.htm
正则表达式快速入门:https://blog.csdn.net/k346k346/article/details/53184800
正则表达式入门:https://blog.csdn.net/weixin_38071135/article/details/82121398
Last updated
Was this helpful?