我正在尝试使用XMLUnit 2.2.0比较两个XHTML文档。但是,这花费了太长时间。我猜该库正在从Internet下载DTD文件。

如何禁用DTD验证?我正在使用以下测试代码:

public class Main {
    public static void main(String args[]) {
        Diff d = DiffBuilder.compare(
                Input.fromString(
                     "<!DOCTYPE html PUBLIC \"-//W3C//DTD XHTML 1.0 Transitional//EN\" \n"
                    +"     \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\">\n"
                    +"<html xmlns=\"http://www.w3.org/1999/xhtml\">\n"
                    +"     <head></head>\n"
                    +"     <body>some content 1</body>\n"
                    +"</html>")).withTest(
                Input.fromString(
                     "<!DOCTYPE html PUBLIC \"-//W3C//DTD XHTML 1.0 Transitional//EN\" \n"
                    +"     \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\">\n"
                    +"<html xmlns=\"http://www.w3.org/1999/xhtml\">\n"
                    +"     <head></head>\n"
                    +"     <body>some content 2</body>\n"
                    +"</html>")).ignoreWhitespace().build();
        if(d.hasDifferences())
            for (Difference dd: d.getDifferences()) {
                System.out.println(dd.toString());
            }
    }
}


阅读DiffBuilder.withDocumentBuilderFactory()XMLUnit Javadoc,我认为我可以像这样设置文档构建器工厂...

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

dbf.setValidating(false);
dbf.setFeature("http://xml.org/sax/features/validation", false);
dbf.setFeature("http://apache.org/xml/features/nonvalidating/load-dtd-grammar", false);
dbf.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);

Diff d = DiffBuilder.compare(Input.fromString(...)).withTest(
     Input.fromString(...)).withDocumentBuilderFactory(dbf)
          .ignoreWhitespace().build();


它不起作用。仅当我从XHTML代码段中删除DOCTYPE定义时,我的代码才能快速运行。

最佳答案

withDocumentBuilderFactory正是您要使用的,但是不幸的是ignoreWhitespace失败了。

在幕后,DiffBuilder创建一个WhitespaceStrippedSource,该Document在不使用您配置的DocumentBuilderFactory的情况下创建DOM Document。这是一个错误。您要为此创建一个问题吗?

使用XMLUnit 2.2.0的一种解决方法是自己创建,类似于

Document control = Convert.toDocument(Input.fromString(...).build(), dbf);
Document test = ...
Diff d = DiffBuilder.compare(Input.fromDocument(control))
             .withTest(Input.fromDocument(test))
             .ignoreWhitespace().build();


编辑:该错误已在XMLUnit 2.2.1中修复,并且该问题的代码现在应该可以正常工作,而无需进行任何更改。

10-08 20:14