我对如何做到这一点有一个大致的想法,但不能确切地指出如何做到这一点我相信可以用某种正则表达式来完成。不知道这里是否有人能指点我正确的方向。
如果我有这样的html字符串
some_html = '<div><b>This is some BOLD text</b></div>'
我想把它分成逻辑块,然后把这些块放入一个数组中,这样我就得到这样的结果
html_array = ["<div>", "<b>", "This is some BOLD text", "</b>","</div>" ]
最佳答案
我不使用regex,而是使用nokogirigem(一个gem,用于解析Rails和Ruby的Aaron Patterson-contributor编写的html)下面是如何使用它的示例:
html_doc = Nokogiri::HTML("<html><body><h1>Mr. Belvedere Fan Club</h1></body></html>")
然后你可以打电话给
html_doc.children
获得nodeset并从那里开始工作html_doc.children # returns a nodeset
关于ruby - 截取html字符串并将其切成小块并将其放入数组的最佳方法是什么?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7886326/