我有一些元素名称包含非ASCII字符的xsd模式。当我使用Eclipse Kepler使用生成Java类命令生成Java类时,生成的类和它们的变量包含非ASCII字符。我想将此非ASCII字符转换为ASCII字符。

我已经在JAVA_TOOL_OPTIONS设置了语言环境

-Duser.country=GB -Duser.language=en

例如
İ -> I
Ç -> C
Ş -> S
Ö -> O
Ğ -> G
Ü -> U
ı -> i
ö -> o
ü -> u
ç -> c
ğ -> g
ş -> s

最佳答案

编辑:既然是通用解决方案,并且不使用外部绑定(bind)文件,所以我在下面提供了 2个选项:

选项1-通用解决方案-创建自定义XJC插件以进行标准化

通用解决方案实际上是:

  • 扩展com.sun.tools.xjc.Plugin抽象类并覆盖JAXB用于命名工件的方法-基本创建一个插件
  • 在 jar
  • 内的jar文件夹的services目录中专门调出实现名称之后,将此实现打包在META-INF
  • 将此新创建的jar与jaxb库一起部署,并通过ANT(下面提供的build.xml,请继续阅读)运行它

  • 为了您的目的,我创建了一个插件,可以从here下载jar,从here下载ant脚本(build.xml)。将jar放在eclipse中的构建路径中,然后编辑ant文件,以提供JAXB库的位置,所生成类的目标包,项目名称和架构位置,然后运行它。 就是这样!

    说明:

    我用一个额外的命令行选项XJC创建了一个自定义-normalize插件,用等效的ASCII替换了所创建的Java类,方法,变量,属性和接口(interface)中的重音字符。
    XJC具有创建自定义插件的功能,可以控制所生成类,变量等的名称,注释和其他属性。 This blog post虽然很老,但可以让您开始了解此类插件实现的基础。

    长话短说,我创建了一个扩展抽象com.sun.tools.xjc.Plugin类的类,覆盖了重要的方法onActivated

    在此方法中,我将com.sun.tools.xjc.Option#setNameConverter设置为自定义类,该类负责覆盖获取类,方法等的必需方法。我也将源也提交给了git repo here,以下是其详细用法:
    import java.text.Normalizer;
    
    import org.xml.sax.ErrorHandler;
    import org.xml.sax.SAXException;
    
    import com.sun.tools.xjc.BadCommandLineException;
    import com.sun.tools.xjc.Options;
    import com.sun.tools.xjc.Plugin;
    import com.sun.tools.xjc.outline.Outline;
    import com.sun.xml.bind.api.impl.NameConverter;
    
    /**
     * {@link Plugin} that normalized the names of JAXB generated artifacts
     *
     * @author popofibo
     */
    public class NormalizeElements extends Plugin {
    
        /**
         * Set the command line option
         */
        @Override
        public String getOptionName() {
            return "normalize";
        }
    
        /**
         * Usage content of the option
         */
        @Override
        public String getUsage() {
            return "  -normalize    :  normalize the classes and method names generated by removing the accented characters";
        }
    
        /**
         * Set the name converted option to a delegated custom implementation of
         * NameConverter.Standard
         */
        @Override
        public void onActivated(Options opts) throws BadCommandLineException {
            opts.setNameConverter(new NonAsciiConverter(), this);
        }
    
        /**
         * Always return true
         */
        @Override
        public boolean run(Outline model, Options opt, ErrorHandler errorHandler)
                throws SAXException {
            return true;
        }
    
    }
    
    /**
     *
     * @author popofibo
     *
     */
    class NonAsciiConverter extends NameConverter.Standard {
    
        /**
         * Override the generated class name
         */
        @Override
        public String toClassName(String s) {
            String origStr = super.toClassName(s);
            return normalize(origStr);
        }
    
        /**
         * Override the generated property name
         */
        @Override
        public String toPropertyName(String s) {
            String origStr = super.toPropertyName(s);
            return normalize(origStr);
        }
    
        /**
         * Override the generated variable name
         */
        @Override
        public String toVariableName(String s) {
            String origStr = super.toVariableName(s);
            return normalize(origStr);
        }
    
        /**
         * Override the generated interface name
         */
        @Override
        public String toInterfaceName(String s) {
            String origStr = super.toInterfaceName(s);
            return normalize(origStr);
        }
    
        /**
         * Match the accented characters within a String choosing Canonical
         * Decomposition option of the Normalizer, regex replaceAll using non POSIX
         * character classes for ASCII
         *
         * @param accented
         * @return normalized String
         */
        private String normalize(String accented) {
            String normalized = Normalizer.normalize(accented, Normalizer.Form.NFD);
            normalized = normalized.replaceAll("[^\\p{ASCII}]", "");
            return normalized;
        }
    }
    

    要以正常的jaxb解码启用此插件,是将这些类打包到jar中,在jar中添加/META-INF/services/com.sun.tools.xjc.Plugin文件,并将其放入构建路径中。

    jar中的/META-INF/services/com.sun.tools.xjc.Plugin文件:

    该文件显示为:
    com.popofibo.plugins.jaxb.NormalizeElements
    

    如前所述,我将其打包在jar中,将其部署在eclipse构建路径中,现在我遇到的运行eclipse kepler with JDK 1.7的问题是我收到此异常(消息):
    com.sun.tools.xjc.plugin Provider <my class> not a subtype
    

    因此,最好使用ANT生成类,以下build.xml可以证明到目前为止所做的工作是正确的:
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <project name="SomeProject" default="createClasses">
    
        <taskdef name="xjc" classname="com.sun.tools.xjc.XJC2Task">
            <classpath>
                <pathelement
                    path="C:/Workspace/jaxb-ri-2.2.7/jaxb-ri-2.2.7/lib/jaxb-xjc.jar" />
                <pathelement
                    path="C:/Workspace/jaxb-ri-2.2.7/jaxb-ri-2.2.7/lib/jaxb-impl.jar" />
                <pathelement
                    path="C:/Workspace/jaxb-ri-2.2.7/jaxb-ri-2.2.7/lib/jaxb2-value-constructor.jar" />
                <pathelement path="C:/Workspace/normalizeplugin_xjc_v0.4.jar" />
            </classpath>
        </taskdef>
    
        <target name="clean">
            <delete dir="src/com/popofibo/jaxb" />
        </target>
    
        <target name="createClasses" depends="clean">
            <xjc schema="res/some.xsd" destdir="src" package="com.popofibo.jaxb"
                encoding="UTF-8">
                <arg value="-normalize" />
            </xjc>
        </target>
    </project>
    

    展示我选择的标准化过程的模式是:
    <xs:element name="shiporder">
      <xs:complexType>
        <xs:sequence>
          <xs:element name="Örderperson" type="xs:string"/>
          <xs:element name="Şhİpto">
            <xs:complexType>
              <xs:sequence>
                <xs:element name="name" type="xs:string"/>
                <xs:element name="address" type="xs:string"/>
                <xs:element name="Çity" type="xs:string"/>
                <xs:element name="ÇoÜntry" type="xs:string"/>
              </xs:sequence>
            </xs:complexType>
          </xs:element>
          <xs:element name="İtem" maxOccurs="unbounded">
            <xs:complexType>
              <xs:sequence>
                <xs:element name="title" type="xs:string"/>
                <xs:element name="note" type="xs:string" minOccurs="0"/>
                <xs:element name="qÜantity" type="xs:positiveInteger"/>
                <xs:element name="price" type="xs:decimal"/>
              </xs:sequence>
            </xs:complexType>
          </xs:element>
        </xs:sequence>
        <xs:attribute name="orderid" type="xs:string" use="required"/>
      </xs:complexType>
    </xs:element>
    
    </xs:schema>
    

    如您所见,我已经设置了要生成类的位置的参数和程序包,瞧-生成的工件中类,方法,变量的ASCII名称(我唯一看到的就是XML注释)这不会影响原因,但也很容易克服):

    上面的屏幕截图显示了名称已被规范化,并由ASCII对应的名称替换(要查看不替换后的外观,请参阅选项2中的屏幕截图)。

    选项2-使用外部绑定(bind)文件

    要删除带重音符号的字符,您可以创建一个自定义绑定(bind)文件,并在生成类时使用它来绑定(bind)您的类和属性名称。引用:Creating an External Binding Declarations File Using JAXB Binding Declarations

    我采用了选项1 中已经提到的xsd,其元素名称包含“重音”(非ASCII)字符:

    如果在不指定外部绑定(bind)的情况下生成类,则会得到以下输出:

    !

    现在,如果我稍稍更改绑定(bind)以生成自己选择的类名称和变量,则将binding.xml编写为:
    <jxb:bindings xmlns:xs="http://www.w3.org/2001/XMLSchema"
        xmlns:jxb="http://java.sun.com/xml/ns/jaxb" version="2.1">
        <jxb:globalBindings localScoping="toplevel" />
    
        <jxb:bindings schemaLocation="some.xsd">
            <jxb:bindings node="//xs:element[@name='Şhİpto']">
                <jxb:class name="ShipTo" />
            </jxb:bindings>
            <jxb:bindings node="//xs:element[@name='Örderperson']">
                <jxb:property name="OrderPerson" />
            </jxb:bindings>
            <jxb:bindings node="//xs:element[@name='Şhİpto']//xs:complexType">
                <jxb:class name="ShipToo" />
            </jxb:bindings>
        </jxb:bindings>
    
    </jxb:bindings>
    

    现在,当我通过指定绑定(bind)文件通过eclipse生成类时:

    在接下来的步骤中,我选择获得的包和绑定(bind)文件,

    注意:如果不使用eclipse生成类,则可能需要将xjc binding compiler checkout 以使用外部绑定(bind)文件。

    10-05 21:31
    查看更多