C#正则表达式积累

现在的位置: 首页 > 综合 > 正文

RSS

C#正则表达式积累

2012年09月25日 ⁄ 综合 ⁄ 共 2660字 ⁄ 字号小中大 ⁄ 评论关闭

感谢：侧身向南边 http://www.cnblogs.com/kissknife/archive/2008/03/23/1118423.html
的分享给了自己学习的机会

-------------------------------------C#的正则表达式-------------------------------------------

@的作用：

string x="D:\\My Huang\\My Doc";

string y = @"D:\My Huang\My Doc";

这两句作用相等

C#中想用的类和方法：

string str = "1";

Regex r1 = new Regex(@"\d");--里面放的是正则格式，如果是一串间的字符，那就原样匹配

bool result = r1.IsMatch(str);

返回的是true

IsMatch（）只要有合适的就返回true，只能做大概的判断

纯记忆部分

\d 0-9的数字--（目前还不明白1.5所不算）用IsMatch（）肯定测不出来，因为既有1又有5.

\D \d的补集

\w 单词字符，指大小写字母、0-9的数字、下划线

\W \w的补集

\s 空白字符，包括换行符\n、回车符\r、制表符\t、垂直制表符\v、换页符\f

\S \s的补集

. 除换行符\n外的任意字符

[…] 里面的格式作为一个整体，匹配的是一个字符，比如[abc]匹配a，匹配b也匹配c

[^…] 匹配非[]内所列出的字符

拆分操作：

string pattern = "[#$]"; //也可以写成string pattern = "#|$";

String input="11$8$8#99";

string[] rs = Regex.Split(input, pattern);

数组是 11 8 8 99

注意：如果想要匹配. $ * ^ ) ( [ ] 等等字符串需要转义，例如"\$" 但是这样就不用\转义了[$]

string i = "hello,world";

Regex result = new Regex("hello,world");//true

result.IsMatch(i)

这两句值得揣摩

Regex result = new Regex("^hello,world$");//true

Regex result = new Regex("hello,worl");//false

Regex result = new Regex("^hello,worl$");//false

Regex result = new Regex("^hello,worl");//true

常用的方法

string i = "hellohello";

Regex result = new Regex("hello");

result.Matches.Count(i);//2

纯粹记忆部分：

与次数相关的

{n} 匹配前面的字符n次

{n,} n次或多于n次

{n,m} n到m次

? 匹配前面的字符0或1次

+ 1次或多于1次

* 0次或式于0次

定位的字符

^ 表示其后的字符必须位于字符串的开始处

$ 表示其前面的字符必须位于字符串的结束处

\b 匹配一个单词的边界注意:所谓的边界不光是空格还有, . - # $ % 等等不是单词中元素的都视为边界。（2,d,_）都不是边界

\B 匹配一个非单词的边界

String str ="hello,everybody,happy everyday";

Regex r = new Regex(@"^hello,([a-z]{5})body,happy \1day$");

([a-z]{5})为一组，后面的\1就算是指的它

r.Match(str).Groups[1].Value

得到"every"

String str = "zhangranzhang";

Regex r = new Regex(@"^(?<a>[a-z]{5})ran\1$");//给组定义一个名字

Console.WriteLine(r.Matches(str).Count);

Console.WriteLine(r.Match(str).Groups[1].Value);//通过索引取值

Console.WriteLine(r.Match(str).Groups["a"].Value);//通过键取值

String str = "zhangzhang ran";

Regex r = new Regex(@"([a-z]{5})\1");

Console.WriteLine(r.Replace(str,"$1"));

取代重复，字段输出zhang ran

Regex r = new Regex(@"(?:[a-z]{5})");

？：表示非捕获组，这时引擎不会将改组保存起来，在用不到组是这样做节省资源

贪婪与非贪婪：默认情况，引擎是贪心的，但是在* + 等表示字数的符号后面加？就改为费贪心的了

String myStr = "everyboy is good boy";

Regex res = new Regex(@".*boy");

Console.WriteLine(res.Match(myStr).Value);//输出everyboy is good boy

非贪婪

Regex res = new Regex(@".*?boy");

Console.WriteLine(res.Match(myStr).Value);//输出everyboy

贪婪与回溯

正则表达式是用回溯的方法来实现贪婪匹配的

String myStr = "everyboy, is good boy";

Regex res = new Regex(@".*boy,");

在上面的表达式中，引擎先扫描整个字符串，当前三个字符boy匹配完其实是移动到末尾匹配到了最后一个boy

但是在匹配,的时候出现问题，只能回溯到最近的一个boy再去匹配,所以输出的内容是

everyboy,

(?>…)这是用来定义非回溯正则的

Regex res = new Regex(@"(?>.*)boy,");

这样就是非回溯的，这样一来，就无法匹配了，IsMatch()返回false

正向预搜索与反向预搜索

正向预搜索包括：正声明(?=)，负声明(?!)

String str = "i love the cute nation the big world";

Regex r = new Regex(@".{3,4}\b(?=world)"); 换成(?!world)就是指后面不是world

匹配后面跟着一个world的字符串

反向预搜索

正声明(?<=)，负声明(?<!)

【上篇】系统设计
【下篇】如何关闭子线程？征集析构函数与多线程的讨论！

作者: applaud

该日志由 applaud 于12年前发表在综合分类下，最后更新于 2012年09月25日.
转载请注明: C#正则表达式积累 | 学步园 +复制链接

抱歉!评论已关闭.

学步园

C#正则表达式积累

作者: applaud

书签

最新文章New

本站推荐

返回首页