现在的位置: 首页 > 综合 > 正文

小脚本来学习正则

2013年09月10日 ⁄ 综合 ⁄ 共 3284字 ⁄ 字号 评论关闭

做前端的,如果你说全部的前端,那么它的特点便是使用的技术多种多样,而且跨域性较大:有设计的、用用户体验分析系的,有编码开发的……显得斑驳庞杂。看似那么多的技术,作为前端人员,不能说都精通,但至少需要有所猎及,以便于“突击”,才称得上胜任。而所谓前端的“编码开发”又可以被认为是一个相当广泛的概念,同你所从事的工作过程中,很可能遇到的 css/js/as/sql 多种开发语言……可见作为前端开发人员,的确需要掌握许多技能。而其中的一环,正则表达式(RegExp),就是这么一个相当突出的一门本领,之所以形容为“突出”,在于正则表达式不但十分有用,而且其思路和控制流程与一般我们熟悉的开发语言有着明显差异与区别。至于个中原理可以参考计算机科学中的“自动机理论”,当然,这里并非讨论学术问题就不深入了。总之,人们都强调再三,正则价值很大,应该把正则学好。我个人很是同意这点,而且觉得,首先不一定要熟悉概念部分,可以直接上机拿例子实验。通过例子很容易观察正则元字符的含义,再去看概念和定义,就容易理解多了。这里部分,最终我们还是要强调记住正则各个元字符所代表的含义,对每一个RegExp
一点一滴加以熟练掌握才是。

为方便记忆,仍然有一些固定组合,如像[/s/S]*的情形,[/d/D]、[/w/W]等,不一定全记住,但归根结底还是互逆关系,这点一定须牢记。

记住单个元字符后,则要考虑多个元字符组合起来的含义。单个元字符好记,多个元字符组合起来的含义则就是千变万化,而且很多都是细节,例如简单类[] 和 复杂模式的候选 (|) 有时候会有点区别的。参考:http://www.iteye.com/topic/239904#661142

另外提醒,实验过程中,不应满足简单的几个例子。因为随着例子的变化,写出来的正则往往会很不同。所以应该找不同的例子,根据字符的格式,找出规律,写出正则。当然,我们的目标首先是要写出正确的正则,匹配命中。然后再优化。就算同一个匹配,他们的正则往往都很不同的,也就是因人而异的,写出来的差别很大。所以就有这一道的优化功夫。

正好遇到了这么两个函数,当初便是为了优化前端的 CSS,或者格式化 CSS,处理好缩进之类的目的,从网上找到了一段小脚本。但发现其原理离不开正则的运用,任务简单之余感觉较容易传播知识,我于是趁机学习一二,并试着写写注释——还请大家点出不正确的地方。

 

推荐网上流传的《正则表达式口诀及教程》:
正则其实也势利,削尖头来把钱揣; (指开始符号^和结尾符号$)
特殊符号认不了,弄个倒杠来引路; (指/. /*等特殊符号)
倒杠后面跟小w, 数字字母来表示; (/w跟数字字母;/d跟数字)
倒杠后面跟小d, 只有数字来表示;
倒杠后面跟小a, 报警符号嘀一声;
倒杠后面跟小b, 单词分界或退格;
倒杠后面跟小t, 制表符号很明了;
倒杠后面跟小r, 回车符号知道了;
倒杠后面跟小s, 空格符号很重要;
小写跟罢跟大写,多得实在不得了;
倒杠后面跟大W, 字母数字靠边站;
倒杠后面跟大S, 空白也就靠边站;
倒杠后面跟大D, 数字从此靠边站;
倒框后面跟大B, 不含开头和结尾;

单个字符要重复,三个符号来帮忙; (* + ?)
0 星加1 到无穷,问号只管0 和1; (*表0-n;+表1-n;?表0-1次重复)
花括号里学问多,重复操作能力强; ({n} {n,} {n,m})
若要重复字符串,园括把它括起来; ((abc){3} 表示字符串“abc”重复3次 )
特殊集合自定义,中括号来帮你忙;
转义符号行不通,一个一个来排队;
实在多得排不下,横杠请来帮个忙; ([1-5])
尖头放进中括号,反义定义威力大; ([^a]指除“a”外的任意字符 )
1竖作用可不小, 两边正则互替换; (键盘上与“/”是同一个键)
1竖能用很多次, 复杂定义很方便;
园括号,用途多;
反向引用指定组,数字排符对应它; (“/b(/w+)/b/s+/1/b”中的数字“1”引用前面的“(/w+)”)
支持组名自定义,问号加上尖括号; (“(?/w+)”中把“/w+”定义为组,组名为“Word”)
园括号,用途多,位置指定全靠它;
问号等号字符串,定位字符串前面; (“/b/w+(?=ing/b)”定位“ing”前面的字符串)
若要定位串后面,中间插个小于号; (“(?<=/bsub)/w+/b”定位“sub”后面的字符串)
问号加个惊叹号,后面跟串字符串;
PHPer都知道, !是取反的意思;
后面不跟这一串,统统符合来报到; (“/w*d(?!og)/w*”,“dog”不符合,“do”符合)
问号小于惊叹号,后面跟串字符串;
前面不放这一串,统统符合来报到;
点号星号很贪婪,加个问号不贪婪;
加号问号有保底,至少重复一次多;
两个问号老规矩,0次1次团团转;
花括号后跟个?,贪婪变成不贪婪;
还有很多装不下,等着以后来增加

好像For PHPer的……不过也没关系 呵呵。

抱歉!评论已关闭.