我无法让 lxml Schematron 验证器识别命名空间。验证在没有命名空间的代码中工作正常。
这适用于 MacOS 10.15 上的 Python 3.7.4 和 lxml 4.4.0
这是schematron文件
<?xml version='1.0' encoding='UTF-8'?>
<schema xmlns="http://purl.oclc.org/dsdl/schematron"
xmlns:ns1="http://foo">
<pattern>
<rule context="//ns1:bar">
<assert test="number(.) = 2">
bar must be 2
</assert>
</rule>
</pattern>
</schema>
这是xml文件
<?xml version="1.0" encoding="UTF-8"?>
<zip xmlns:ns1="http://foo">
<ns1:bar>3</ns1:bar>
</zip>
这是python代码
from lxml import etree, isoschematron
from plumbum import local
schematron_doc = etree.parse(local.path('rules.sch'))
schematron = isoschematron.Schematron(schematron_doc)
xml_doc = etree.parse(local.path('test.xml'))
is_valid = schematron.validate(xml_doc)
assert not is_valid
我得到了什么: lxml.etree.XSLTParseError: xsltCompilePattern : 编译失败 '//ns1:bar'
如果我从 XML 文件和 Schematron 文件中删除
ns1
,则该示例运行良好——没有错误消息。在我缺少的 lxml Schematron 中注册命名空间必须有一个技巧。有没有人做过这个?
最佳答案
事实证明,有一种特定的方法可以在 Schematron 中注册 namespace 。它在 Schematron ISO standard 中描述
它只需要对 Schematron 文件稍作改动,添加“ns”元素如下:
<?xml version='1.0' encoding='UTF-8'?>
<schema xmlns="http://purl.oclc.org/dsdl/schematron">
<ns uri="http://foo" prefix="ns1"/>
<pattern>
<rule context="//ns1:bar">
<assert test="number(.) = 2">
bar must be 2
</assert>
</rule>
</pattern>
</schema>
我不会删除这个问题,因为缺少使用 namespace 的 Schematron 规则示例。希望它可以对某人有所帮助。
关于python - 在 Python 中使用 lxml 针对 Schematron 验证带有命名空间的 XML,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58496860/