我正在使用XmlBeans 2.6.0编译一些XSD文件,其中包含希腊语单词的枚举:
<xs:simpleType name="t_series_report">
<xs:restriction base="xs:string">
<xs:enumeration value="Γενική"/>
<xs:enumeration value="Ειδική"/>
</xs:restriction>
</xs:simpleType>
使用XmlBeans的ZIP二进制发行版的xbean.jar中包含的Ant任务执行编译。 XSD文件另存为utf-8,并且也可以在标头java文件中正确说明
<?xml version="1.0" encoding="UTF-8"?>
问题是XmlBeans生成的Java文件似乎保存在ANSI字符集中,并且在编译过程中出现如下错误:
[xmlbean] C:\projects\myproject\workspace\prj\build\xmlbeans\test\src\com\company\project\schema\myschematype\cl\cle\ext\TMyType.java:61: illegal character: \8220
[xmlbean] static final int INT_ΓΕ�?ΙΚΉ = 1;
[xmlbean]
有什么方法可以强制XmlBeans将生成的Java文件保存为UTF-8而不是ANSI?
最佳答案
我们有一个类似的问题,即使用XMLBeans的maven任务来编译包含希腊“ Omega”的某种模式。
问题是,XMLBeans(至少从2.5.0版开始)始终使用Javas平台默认编码,该编码只能通过使用-Dfile.encoding=UTF-8
调用JVM来设置。
对于我们的Maven项目,解决方案是不使用插件。相反,我们使用exec
插件调用了XMLBeans,因此我们可以控制编码。这是pom.xml
的片段
<plugin>
<groupId>org.codehaus.mojo</groupId>
<artifactId>exec-maven-plugin</artifactId>
<executions>
<execution>
<id>exec-2.1.0</id>
<phase>generate-sources</phase>
<goals>
<goal>exec</goal>
</goals>
<configuration>
<executable>java</executable>
<arguments>
<argument>-Dfile.encoding=${project.build.sourceEncoding}</argument>
<argument>-classpath</argument>
<!-- automatically creates the classpath using all project dependencies,
also adding the project build directory -->
<classpath/>
<argument>org.apache.xmlbeans.impl.tool.SchemaCompiler</argument>
<argument>-src</argument>
<argument>${project.build.directory}/generated-sources</argument>
<argument>-srconly</argument>
<argument>-d</argument>
<argument>${project.build.directory}/classes</argument>
<argument>-javasource</argument>
<argument>1.6</argument>
<argument>${basedir}/src/main/2.1.0/schema/</argument>
<argument>src/main/2.1.0/config/FooBar_v2.1.0.xsdconfig</argument>
</arguments>
</configuration>
</execution>
我想这种方法也适用于
Ant
。更简单的解决方案是这样调用ant:
ant -Dfile.encoding=UTF-8 build-or-whatever
但这显然仅在所有源文件都为UTF-8的情况下才有效!