现在的位置: 首页 > 综合 > 正文

Groovy Tip 35 正则表达式 四

2012年06月29日 ⁄ 综合 ⁄ 共 1313字 ⁄ 字号 评论关闭

                     Groovy Tip 35  正则表达式 四

 

 

 

我们知道,在正则表达式中,有一些字符串被用来的表达一些特殊的用途。比如,"."代表的是所有的字符;"^"代表的是非;等等。看到这些用法的时候,我们就可以反过来问了,如果"."代表的是所有的字符的话,那么用什么来匹配字符串中的"."呢?

为了解决这样的问题,在正则表达式中需要用"/"加上原字符串来匹配这样的字符。下面来举一个例子:

 

      println 'a.c' ==~ /a/.c/

   

运行结果为:

true

 

 

其他的这样一些字符还有:"{"、"["、"("、")"、"/"、"^"、"$"、"|"、"?"、"*"和"+"等等。

知道了这样的原则,我们就能理解我们在编码过程中的一些奇怪问题,比如我们经常操作文件名字符串,如下所示的一个文件名:

 

      def fn = 'test.txt'

 

我们就想拆分出文件名和类型来,经常我们想用split方法,如下所示:

 

      def fns = fn.split('.')

     

      println fns

 

 

这个想法很直接,也很简单,但运行的结果却是:

{}

 

这显然不是我们想要的结果。

问题出在哪里呢?就是因为"."是匹配所有的字符的,它能够匹配"test.txt"中的任何一个字符,所以做split方法也就无法下手了。

正确的代码如下:

 

      def fns1 = fn.split(//./)

     

      println fns1

   

 

运行结果为:

{"test", "txt"}

 

 

这才是我们想要的结果。

值得注意的是,"."并不真正的是匹配所有的字符,有些字符它也不能匹配,如下面的代码是可以匹配的:

 

      println 'abc/ndef' ==~ /a.c/ndef/

 

 

运行结果为:

true

 

 

但下面的代码就不能匹配了:

 

      println 'abc/ndef' ==~ /abc.def/

 

 

运行结果为:

false

 

 

即"."并不能匹配"/n"--换行符。

如果我们非要"."来匹配所有的字符,也是有办法的,"(?s)"来强制它匹配所有的字符,示例代码如下:

 

      println 'abc/ndef' ==~ /(?s)abc.def/

 

 

运行结果为:

true

 

对于"(?s)"这样的东东,我们称之为标志(flag),除了"(?s)"标志外,还有几个标志比较有用。

首先是"(?i)",用来作为忽略大小写的标志,如下的示例代码:

 

      println 'abcDEF' ==~ /abc(?i)def/

 

 

运行结果为:

true

 

 

如果是下面的代码:

 

      println 'abcDEF' ==~ /abcdef/

   

 

运行结果就是:

false

 

 

既然"(?i)",用来作为忽略大小写的标志,就需要一个结束忽略大小写的标志。这就是"(?-i)",如下面的代码就是匹配的:

 

      println 'abcDEFg' ==~ /abc(?i)def(?-i)g/

 

 

运行结果为:

true

 

而下面的代码则是不匹配的:

 

      println 'abcDEFG' ==~ /abc(?i)def(?-i)g/

 

 

运行结果为:

false

 

 

 

抱歉!评论已关闭.