我无法让 lxml Schematron 验证器识别命名空间。验证在没有命名空间的代码中工作正常。

这适用于 MacOS 10.15 上的 Python 3.7.4 和 lxml 4.4.0

这是schematron文件

<?xml version='1.0' encoding='UTF-8'?>
<schema xmlns="http://purl.oclc.org/dsdl/schematron"
  xmlns:ns1="http://foo">
  <pattern>
    <rule context="//ns1:bar">
      <assert test="number(.) = 2">
       bar must be 2
      </assert>
    </rule>
  </pattern>
</schema>

这是xml文件

<?xml version="1.0" encoding="UTF-8"?>
<zip xmlns:ns1="http://foo">
    <ns1:bar>3</ns1:bar>
</zip>

这是python代码

from lxml import etree, isoschematron
from plumbum import local
schematron_doc = etree.parse(local.path('rules.sch'))
schematron = isoschematron.Schematron(schematron_doc)
xml_doc = etree.parse(local.path('test.xml'))
is_valid = schematron.validate(xml_doc)
assert not is_valid

我得到了什么: lxml.etree.XSLTParseError: xsltCompilePattern : 编译失败 '//ns1:bar'

如果我从 XML 文件和 Schematron 文件中删除 ns1,则该示例运行良好——没有错误消息。

在我缺少的 lxml Schematron 中注册命名空间必须有一个技巧。有没有人做过这个?

最佳答案

事实证明,有一种特定的方法可以在 Schematron 中注册 namespace 。它在 Schematron ISO standard 中描述

它只需要对 Schematron 文件稍作改动,添加“ns”元素如下:

<?xml version='1.0' encoding='UTF-8'?>
<schema xmlns="http://purl.oclc.org/dsdl/schematron">
  <ns uri="http://foo" prefix="ns1"/>
  <pattern>
    <rule context="//ns1:bar">
      <assert test="number(.) = 2">
       bar must be 2
      </assert>
    </rule>
  </pattern>
</schema>

我不会删除这个问题,因为缺少使用 namespace 的 Schematron 规则示例。希望它可以对某人有所帮助。

关于python - 在 Python 中使用 lxml 针对 Schematron 验证带有命名空间的 XML,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58496860/

10-12 21:06