我需要阅读一个HTML文件并在其中搜索一些标签。根据结果,需要删除一些标签,更改其他标签,甚至可能完善一些属性,然后将其写回。
NSXMLDocument是要走的路吗?我认为在这种情况下确实不需要解析器,它甚至意味着更多的工作。而且我不想触摸整个文件,我要做的就是将文件加载到内存中,更改某些内容,然后再次保存。
请注意,我将处理HTML,而不是XHTML。对于NSXMLDocument来说可能是个问题吗?某些不匹配的标签或未关闭的标签可能会使它停止工作。
最佳答案
NSXMLDocument是必经之路。这样,您可以使用Xpath / Xquery查找所需的标签。错误的HTML可能是一个问题,但是您可以设置NSXMLDocumentTidyHTML,除非确实很糟糕,否则应该可以。
关于objective-c - 处理HTML,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6125269/