最近在做一个资讯网站时,用到了正则表达式,对于之前没接触过的自己来说,是一门新知识,下面做一下学习笔记
常用的元字符:
(1) . 匹配除换行符以为的任意字符
(2) \w 匹配字母或数字或下划线或汉字
(3) \s 匹配任意的空白符
(4) \d 匹配数字
(5) \b 匹配单词的开始或结束
(6) ^ 匹配字符串的开始
(7) $ 匹配字符串的结束
(8) * 重复任意次,可能是0次
(9) + 重复一次或更多次
(10) {n} 重复n次
(11) {n,m} 重复n到m次
(12) {n,} 重复n次或更多次
(12) ? 重复0次或1次
举例:^\d{5,12}$ 必须为5到12个数字,{2}不多不少重复两次,{5,12}重复的次数不能少于5次,不能多于12次
字符转义
如果想查找元字符本身的话,就要用到字符转义,如使用\.来查找.,使用\*来查找*,使用\\来查找\,例如csdn\.net匹配csdn.net,C:\\Windows匹配C:\Windows
字符类
如果想查找字符类的话,就要用到方括号,如[a-z]查找a到z中的任意一个
分支条件
0\d{2}-\d{8}|0\d{3}-\d{7} 匹配两种以连字号分隔的电话号码:一种是三位区号,8位本地号(如010-12345678),一种是4位区号,7位本地号(0376-2233445)