我正在使用XmlBeans 2.6.0编译一些XSD文件,其中包含希腊语单词的枚举:

<xs:simpleType name="t_series_report">
    <xs:restriction base="xs:string">
        <xs:enumeration value="Γενική"/>
        <xs:enumeration value="Ειδική"/>
    </xs:restriction>
</xs:simpleType>


使用XmlBeans的ZIP二进制发行版的xbean.jar中包含的Ant任务执行编译。 XSD文件另存为utf-8,并且也可以在标头java文件中正确说明

<?xml version="1.0" encoding="UTF-8"?>


问题是XmlBeans生成的Java文件似乎保存在ANSI字符集中,并且在编译过程中出现如下错误:

  [xmlbean] C:\projects\myproject\workspace\prj\build\xmlbeans\test\src\com\company\project\schema\myschematype\cl\cle\ext\TMyType.java:61: illegal character: \8220
  [xmlbean]         static final int INT_ΓΕ�?ΙΚΉ = 1;
  [xmlbean]


有什么方法可以强制XmlBeans将生成的Java文件保存为UTF-8而不是ANSI?

最佳答案

我们有一个类似的问题,即使用XMLBeans的maven任务来编译包含希腊“ Omega”的某种模式。

问题是,XMLBeans(至少从2.5.0版开始)始终使用Javas平台默认编码,该编码只能通过使用-Dfile.encoding=UTF-8调用JVM来设置。

对于我们的Maven项目,解决方案是不使用插件。相反,我们使用exec插件调用了XMLBeans,因此我们可以控制编码。这是pom.xml的片段

<plugin>
            <groupId>org.codehaus.mojo</groupId>
            <artifactId>exec-maven-plugin</artifactId>
            <executions>

                <execution>
                    <id>exec-2.1.0</id>
                    <phase>generate-sources</phase>
                    <goals>
                        <goal>exec</goal>
                    </goals>
                    <configuration>
                        <executable>java</executable>
                        <arguments>
                            <argument>-Dfile.encoding=${project.build.sourceEncoding}</argument>
                            <argument>-classpath</argument>
                            <!-- automatically creates the classpath using all project dependencies,
                            also adding the project build directory -->
                            <classpath/>
                            <argument>org.apache.xmlbeans.impl.tool.SchemaCompiler</argument>
                            <argument>-src</argument>
                            <argument>${project.build.directory}/generated-sources</argument>
                            <argument>-srconly</argument>
                            <argument>-d</argument>
                            <argument>${project.build.directory}/classes</argument>
                            <argument>-javasource</argument>
                            <argument>1.6</argument>
                            <argument>${basedir}/src/main/2.1.0/schema/</argument>
                            <argument>src/main/2.1.0/config/FooBar_v2.1.0.xsdconfig</argument>
                        </arguments>
                    </configuration>
                </execution>


我想这种方法也适用于Ant

更简单的解决方案是这样调用ant:

ant -Dfile.encoding=UTF-8 build-or-whatever


但这显然仅在所有源文件都为UTF-8的情况下才有效!

10-07 13:10