我有这个带有XML信息的Java字符串,并且我试图使用Java正则表达式过滤掉单词之间的所有垃圾,以形成一个括在方括号中的单词,例如[被告]。

我想从这里开始:

<w:p><w:r><w:t>[</w:t></w:r><st1:PlaceName w:st="on"><w:r><w:t>DEFENDANT</w:t></w:r>

</st1:PlaceName><w:r><w:t> </w:t></w:r><st1:PlaceType w:st="on"><w:r><w:t>CITY</w:t></w:r>

</st1:PlaceType><w:r><w:t>], [</w:t></w:r><st1:place w:st="on"><st1:PlaceName w:st="on"><w:r>

<w:t>DEFENDANT</w:t></w:r></st1:PlaceName><w:r><w:t> </w:t></w:r><st1:PlaceType w:st="on"><w:r>

<w:t>STATE</w:t></w:r></st1:PlaceType></st1:place><w:r><w:t>] [DEFENDANT ZIP]</w:r><w:r>


对此:

<w:p><w:r><w:t>[DEFENDANT CITY], [DEFENDANT STATE] [DEFENDANT ZIP]</w:r><w:r>


我已经在regexPlanet上使用(\[)<.+>+([A-Z ]+\])等正则表达式表达式进行了广泛测试,但无济于事。

最佳答案

不要使用Regex解析XML。只需使用内置的Java XML库。

关于java - 如何使用Java正则表达式过滤XML文件,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/16070181/

10-13 03:16