阅读this之后,我一直在尝试实现一种自定义数据类型,以供RelaxNG XML验证器(Jing)使用。我已经通过命令行成功运行了Jing(他们称为datatype-sample)提供的示例实现,但是我一直无法通过Java代码来实现。

从命令行(Windows):

> set CLASSPATH=path\to\jing-20091111\bin\jing.jar;path\to\jing-20091111\sample\datatype\datatype-sample.jar
> cd path\to\jing-20091111\sample\datatype
> java com.thaiopensource.relaxng.util.Driver datatype-sample.rng valid.xml

验证没有任何问题。但是现在我正尝试使用以下Java代码中的相同数据类型库:

package rngdatatype;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.UnsupportedEncodingException;
import javax.xml.XMLConstants;
import javax.xml.transform.stream.StreamSource;
import javax.xml.validation.Schema;
import javax.xml.validation.SchemaFactory;
import javax.xml.validation.Validator;
import org.xml.sax.SAXException;

public class Main {

    public static void main(String[] args) throws UnsupportedEncodingException, FileNotFoundException, SAXException, IOException {
        // make sure our jars are on classpath
        System.out.println("Classpath: " + System.getProperty("java.class.path"));

        // args
        String rng = args[0];
        String xml = args[1];
        File rngFile = new File(rng);
        File xmlFile = new File(xml);

        // setup rng validator through JAXP
        System.setProperty(SchemaFactory.class.getName() + ":" + XMLConstants.RELAXNG_NS_URI, "com.thaiopensource.relaxng.jaxp.XMLSyntaxSchemaFactory");
        SchemaFactory rngSchemaFactory = SchemaFactory.newInstance(XMLConstants.RELAXNG_NS_URI);

        // obtain a schema object
        InputStreamReader rngReader = new InputStreamReader(new FileInputStream(rngFile), "UTF-8");
        Schema schema = rngSchemaFactory.newSchema(new StreamSource(rngReader));

        // validate using schema based validator
        Validator validator = schema.newValidator();
        InputStreamReader xmlReader = new InputStreamReader(new FileInputStream(xmlFile), "UTF-8");
        validator.validate(new StreamSource(xmlReader));
    }
}

第一个参数是具有以下内容的文件的路径:

<element name="balancedString"
   xmlns="http://relaxng.org/ns/structure/1.0"
   datatypeLibrary="http://www.thaiopensource.com/relaxng/datatypes/sample">
  <data type="balancedString"/>
</element>

第二个参数是具有以下内容的文件的路径:

<balancedString>foo(bar(baz))</balancedString>

这给了我以下输出:
Classpath: path\to\RNGDataType\lib\datatype-sample.jar;path\to\RNGDataType\lib\jing.jar;path\to\RNGDataType\build\classes;path\to\RNGDataType\src
Exception in thread "main" org.xml.sax.SAXParseException: datatype library "http://www.thaiopensource.com/relaxng/datatypes/sample" not recognized
...

这清楚表明该数据类型无法解析。据我所知,满足此要求的唯一要求(在类路径上同时具有jing.jardatatype-sample.jar)。那我在做什么错?

附言:为了使上述代码正常工作,您必须在类路径上放置jing.jardatatype-sample.jar并为其提供参数,其中第一个是datatype-sample.rng的路径,第二个是valid.xmlinvalid.xml的路径。所有这些都通过Jing分发。

编辑1:当使用具有适当java -jar文件的JAR(MANIFEST.MF)运行时,上述程序在我的IDE之外也不起作用。当手动设置classpath(java -classpath)时,它也不起作用。因此,我怀疑实际代码有问题。

最佳答案

似乎通过JAXP API通过Jing使用自定义数据类型库已被打破。即使应该,它也不起作用。也许需要在某个地方设置一些其他属性,但我对此并不了解。

所以我想我通过模仿Jing的com.thaiopensource.relaxng.util.Driver并因此使用Jing自己的API来执行验证找到了一种解决方法。请注意,这样做会限制您的代码,因此仅适用于Jing。

package rngdatatype;

import com.thaiopensource.validate.SchemaReader;
import com.thaiopensource.validate.ValidationDriver;
import com.thaiopensource.validate.auto.AutoSchemaReader;
import java.io.File;
import java.io.IOException;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;

public class JingApi {

    public static void main(String[] args) throws SAXException, IOException {
        String rng = args[0];
        String xml = args[1];
        File rngFile = new File(rng);
        File xmlFile = new File(xml);

        SchemaReader sr = new AutoSchemaReader();
        ValidationDriver driver = new ValidationDriver(sr);
        InputSource inRng = ValidationDriver.fileInputSource(rngFile);
        inRng.setEncoding("UTF-8");
        driver.loadSchema(inRng);
        InputSource inXml = ValidationDriver.fileInputSource(xmlFile);
        inXml.setEncoding("UTF-8");
        driver.validate(inXml);
    }
}

这使您可以基于RNG模式(使用自定义数据类型库)从Java代码验证XML文件。请注意,我前面提到的Diver类不能直接使用。

上面的程序使用与我自己的问题中的示例相同的类路径和参数。

编辑1 ---------------------------------------------

摆弄一些东西后,我发现需要设置属性,以便在使用自定义数据类型库时使我的JAXP示例与Jing一起播放。在获得SchemaFactory实例之后,只需添加以下行:

rngSchemaFactory.setProperty("http://relaxng.org/properties/datatype-library-factory", new org.relaxng.datatype.helpers.DatatypeLibraryLoader());

与使用Jing本机API相比,这是一种更为优雅的解决方案。

/ Edit1 --------------------------------------------

10-05 21:50