我有这个带有XML信息的Java字符串,并且我试图使用Java正则表达式过滤掉单词之间的所有垃圾,以形成一个括在方括号中的单词,例如[被告]。
我想从这里开始:
<w:p><w:r><w:t>[</w:t></w:r><st1:PlaceName w:st="on"><w:r><w:t>DEFENDANT</w:t></w:r>
</st1:PlaceName><w:r><w:t> </w:t></w:r><st1:PlaceType w:st="on"><w:r><w:t>CITY</w:t></w:r>
</st1:PlaceType><w:r><w:t>], [</w:t></w:r><st1:place w:st="on"><st1:PlaceName w:st="on"><w:r>
<w:t>DEFENDANT</w:t></w:r></st1:PlaceName><w:r><w:t> </w:t></w:r><st1:PlaceType w:st="on"><w:r>
<w:t>STATE</w:t></w:r></st1:PlaceType></st1:place><w:r><w:t>] [DEFENDANT ZIP]</w:r><w:r>
对此:
<w:p><w:r><w:t>[DEFENDANT CITY], [DEFENDANT STATE] [DEFENDANT ZIP]</w:r><w:r>
我已经在regexPlanet上使用
(\[)<.+>+([A-Z ]+\])
等正则表达式表达式进行了广泛测试,但无济于事。 最佳答案
不要使用Regex解析XML。只需使用内置的Java XML库。
关于java - 如何使用Java正则表达式过滤XML文件,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/16070181/