现在的位置: 首页 > 综合 > 正文

Java如何移除html标签(How to remove the html tags)

2017年10月06日 ⁄ 综合 ⁄ 共 683字 ⁄ 字号 评论关闭

在用fck编辑文字时,存入数据库会有html标签,但有的地方显示会限制字数,导致html的闭合标签被截掉了,和页面上其他标签形成闭合标签,导致页面显示出错。所以,在显示时先把html标签去了,然后在截取。
public class RemoveHTML {

    public static String stripHtmlTags(String strInput) {
String noHTMLString = "";
if (StringUtils.isNotBlank(strInput)) {
noHTMLString = strInput.replaceAll("\\<.*?\\>", "");
}
return noHTMLString;
}

    public static void main(String[] args) {
        
    String strHTML= "<html>"+
                    "<head>"+
                    "<title>Convert HTML to Text String. </title>"+
                    "</head>"+
                    
                    "<body>"+
                    "This is HTML String of java's source code . "+
                    "</body>"+
                    "</html>";
        
        String stringWithoutHTML=removeHTML(strHTML);
        
        System.out.println(stringWithoutHTML);
    }
}

抱歉!评论已关闭.