我试图解析具有以下(大大简化)结构的文档。每个文档可以具有一个或多个ORB段,每个ORB段之后是一个或多个OBX段。 OBX段直接与先前的OBR段相关。
<obr> ...... </obr>
<obx> ...... </obx>
<obx> ...... </obx>
<obx> ...... </obx>
<obr> ...... </obr>
<obx> ...... </obx>
<obx> ...... </obx>
以下是更详细但仍简化的示例:
<OBR>
<OBR.1>
<OBR.1.1>1</OBR.1.1>
</OBR.1>
<OBR.2/>
<OBR.3>
<OBR.3.1>12345678</OBR.3.1>
<OBR.3.2>PLS</OBR.3.2>
</OBR.3>
<OBR.4>
<OBR.4.1>CRP, LFT, Ue</OBR.4.1>
<OBR.4.2>C Reactive protein, Liver Function Tests, Urea, Elec, Creat</OBR.4.2>
<OBR.4.3>PLS</OBR.4.3>
</OBR.4>
</OBR>
<OBX>
<OBX.1>
<OBX.1.1>1</OBX.1.1>
</OBX.1>
<OBX.2>
<OBX.2.1>NM</OBX.2.1>
</OBX.2>
<OBX.3>
<OBX.3.1>CRP</OBX.3.1>
<OBX.3.2>C-Reactive Protein</OBX.3.2>
<OBX.3.3>PLS</OBX.3.3>
</OBX.3>
</OBX>
我需要开发和xPath表达式/ Java代码,可以从特定的OBR段中提取文本以及多行文本。直接使用以下方法在整个文档中提取索引的OBX.3.2:
public Object read(String expression, QName returnType, int index) {
expression = "(" + expression + ")[" + Integer.toString(index) + "]";
try {
XPathExpression xPathExpression = xPath.compile(expression);
return xPathExpression.evaluate(xmlDocument, returnType);
} catch (XPathExpressionException ex) {
ex.printStackTrace();
return null;
}
}
但是我不确定如何找到与第二个OBR相关联的索引的OBX.3.2,或者实际上如何计算每个OBR的OBX段的数量(如果我新增这个,我可能可以解决问题)。任何指导或意见将不胜感激。
我还尝试了Kayessian方法($ ns1 [count(。| $ ns2)= count($ ns2)])来计数元素,得出:
count( //OBR[3]/following-sibling::OBX [ count (.|//OBR[4]/preceding-sibling::OBX) = count(//OBR[4]/preceding-sibling::OBX )])
该表达式给出索引的OBR和下一个OBR下方的OBX元素数。但是,它不能正确处理组中的最后一个OBR(因为后面没有ORB)
最佳答案
我将使用XSLT将原始XML转换为更方便的形式并处理结果。
XSLT转换示例:
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes" />
<xsl:template match="OBR">
<xsl:variable name="$cur_OBR" select="."/>
<xsl:variable
name="obx"
select="following-sibling::OBX[preceding-sibling::OBR[1] = $cur_OBR]"/>
<OBR position="{position()}">
<xsl:for-each select="*/*">
<xsl:variable name="suffix"
select="substring-after(name(), 'OBR')"/>
<xsl:variable name="rel_obx"
select="$obx/*/*[ends-with(name(), $suffix)]"/>
<xsl:apply-templates select="." mode="sub_OBR">
<xsl:with-params name="suffix" select="$suffix"/>
<xsl:with-params name="rel_obx" select="$rel_obx"/>
</xsl:apply-templates>
</xsl:for-each>
</OBR>
</xsl:template>
<xsl:template match="OBX"/>
<xsl:template mode="sub_OBR" match="*">
<xsl:param name="suffix" select="substring-after(name(), 'OBR')"/>
<xsl:param name="rel_obx"/>
<xsl:element name="concat('OBR', $suffix)">
<OBR>
<xsl:apply-templates select="text()"/>
</OBR>
<xsl:for-each select="$rel_obx">
<OBX>
<xsl:apply-templates select="text()"/>
</OBX>
</xsl:for-each>
</xsl:element>
</xsl:template>
</xsl:stylesheet>
我没有运行它,但要检查它是否绝对正确。您还可以看到,需要一个变量来为xpath:
following-sibling::OBX[preceding-sibling::OBR[1] = $cur_OBR]
的OBR选择相应的OBX元素。