如题:
/**
* 去除html格式,提取文字信息
*/
public static String getContent(String content){
if(StringUtil.isNull(content)){
return "";
}
String txtcontent = setTextAreaHtml(content).replaceAll("</?[^>]+>", ""); //剔出<html>的标签
txtcontent = txtcontent.replaceAll("<a>\\s*|\t|\r|\n</a>", "");//去除字符串中的空格,回车,换行符,制表符
return txtcontent;
}
public static String setTextAreaHtml(String content){
return content.replaceAll("<", "<").replaceAll("gt;", ">").replaceAll("&", "&").replaceAll(""", "\"").replaceAll("'", "'").replaceAll(" "," ");
}
该博客主要围绕使用Java剔除Html标签展开,虽未给出具体内容,但明确了核心主题是利用Java语言处理Html标签的剔除操作。
858

被折叠的 条评论
为什么被折叠?



