现在的位置: 首页 > 综合 > 正文

正则表达式的威力–轻松消除HTML代码

2013年05月19日 ⁄ 综合 ⁄ 共 626字 ⁄ 字号 评论关闭

      正则表达式再次让我震撼,寥寥数行代码就可以完成普通代码不易实现的功能,至少是实现起来比较复杂的功能。

一、清楚内容中的Javsscript 代码

 1 Function ClearJSCode(originCode)
 2 
 3   Dim reg
 4 
 5   set reg = New RegExp
 6 
 7   reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
 8   reg.IgnoreCase = True
 9   reg.Global = True
10 
11   clearJSCode = reg.Replace(originCode, "")
12 
13 End Function
14 

 二、清除内容中的HTML代码

 1 Function ClearHTMLCode(originCode)
 2 
 3     Dim reg 
 4     set reg = new RegExp 
 5 
 6     reg.Pattern = "<[^>]*>"
 7     reg.IgnoreCase = True
 8     reg.Global = True
 9  
10     ClearHTMLCode = reg.Replace(originCode, "")
11 
12 End Function
13 

现在好多网站的内容都是使用采集程序生成的,使用上边的代码就可以轻松的将内容中的HTML和JS代码清除掉。

抱歉!评论已关闭.