现在的位置: 首页 > 综合 > 正文

网页爬虫之邮件获取

2018年03月31日 ⁄ 综合 ⁄ 共 606字 ⁄ 字号 评论关闭

今天学习了java基础中的正则表达式。

实战练习:获取某论坛上网友回复中的邮件地址。

废话不多说,上代码喽!

public static void getMails_1(){
  try {
   URL url = new URL("http://tieba.baidu.com/p/3235378655");
   URLConnection con = url.openConnection();
   BufferedReader bufr = new BufferedReader(new InputStreamReader(con.getInputStream()));
   String line = null;
   String mailreg = "\\w+@\\w+(\\.\\w+)+";
   Pattern p = Pattern.compile(mailreg);
   while ((line = bufr.readLine()) != null) {
    Matcher m = p.matcher(line);
    while (m.find()) {
     System.out.println(m.group());
    }
   }
   
   
   
  } catch (Exception e) {
   e.printStackTrace();
  }
 }

 

介绍:本人平时喜欢breaking,经常逛一下百度贴吧的breaking吧。里面有好多网友分享的资料。如果想要一份教程,就需要回复自己的邮箱。利用正则表达式,轻松获取网友的邮箱地址。当然只是小练习,不要给别人发垃圾邮件哦。

 

抱歉!评论已关闭.