本文介绍了如何处理整个xml,然后返回片段的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有以下类似的xml用于etl处理

I have xml like following for etl processing

<?xml version="1.0"?>
<OMeS  version="2.3"   adapId="nokrww"  xmlns="pm/cnf_rnc_nsn.7.0.xsd">
  <PMSetup  startTime="2018-10-23T11:00:00.000+05:00:00" interval="15">
    <PMMOResult>
      <MO dimension="network_element">
        <DN><![CDATA[PLMN-PLMN/RNC-3/WBTS-500/WCEL-1]]></DN>
      </MO>
      <MO dimension="MCCMNC">
        <DN><![CDATA[PLMN-PLMN/MCC-4/MNC-5]]></DN>
      </MO>
      <PMTarget  measurementType="L3Iub">
        <M1005C0>424</M1005C0>
        <M1005C1>858</M1005C1>
    </PMMOResult>
    <PMMOResult>
      <MO dimension="network_element">
        <DN><![CDATA[PLMN-PLMN/RNC-3/WBTS-501/WCEL-2]]></DN>
      </MO>
      <MO dimension="MCCMNC">
        <DN><![CDATA[PLMN-PLMN/MCC-5/MNC-6]]></DN>
      </MO>
      <PMTarget  measurementType="L3Iub">
        <M1005C0>201</M1005C0>
        <M1005C1>300</M1005C1>
    </PMMOResult>
</PMSetup>
</OMeS>

如果我对片段RootElementName使用 PMMOResult ,则无法访问startTime属性.

If I use PMMOResult for fragmentRootElementName I can't access startTime attribute.

如果我将 OMes 用作fragmentRootElementName,则我只有一项要写

If i use OMes as fragmentRootElementName i have only one item to write

如何覆盖StaxEventItemReader以使用OMeS作为fragmentRootElementName读取整个文档,然后访问PMMOResult标签下的所有嵌套元素,进行一些更改并返回为List?

How can I override StaxEventItemReader to read whole document using OMeS as fragmentRootElementName and then access all nested elements under PMMOResult tags, do some changes and return as List?

推荐答案

这是不可能的. StaxEventItemReader 一次只能读取一种类型(从项读取器的基本合同中: ItemReader< T> ).可以将 fragmentRootElementName 设置为 PMSetup 以获取 startTime 属性,但是最终会得到一个巨大的 PMSetup 具有所有 PMMOResult 子元素的内存中的元素项,这不是您想要的.

That's not possible. The StaxEventItemReader can read only one type at a time (from the base contract of an item reader: ItemReader<T>). Setting the fragmentRootElementName to PMSetup to get the startTime attribute is possible, but you would end up with one huge PMSetup element item in memory with all PMMOResult child elements, which is not what you would want.

所以我建议分两步进行:

So I would recommend to proceed in two step:

  • 步骤1:使用Tasklet从标头"元素中获取所需的任何元数据(并在需要时通过步骤执行上下文将其传递到步骤2)
  • 第2步:通过将中的 fragmentRootElementName 设置为 PMMOResult ,使用面向块的Tasklet来处理块中的 PMMOResult 元素.StaxEventItemReader
  • step 1: use a tasklet to get any meta-data needed from the "header" elements (and pass it to step 2 through the step execution context if needed)
  • step 2: use a chunk-oriented tasklet to process PMMOResult elements in chunks by setting the fragmentRootElementName to PMMOResult in the StaxEventItemReader

希望这会有所帮助.

这篇关于如何处理整个xml,然后返回片段的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

09-16 01:28