在使用DOM4j解析文档的时候,遇见上了 Invalid byte 2 of 2-byte UTF-8 sequence 错误。这个错误一看就是编码的问题,用SAXReader解析的是我自己用Dom4j生成的文档,在生成的文档时候没有指定编码格式,所以需要在写入XML文件的时候指定编码格式。
具体的代码是:
OutputFormat format = new OutputFormat("", true, "UTF-8");
String fileName = "xx.xml";
XMLWriter writer = new XMLWriter(new FileOutputStream(fileName), format);
//.....
//....将doc写入writer