如何在Android中解析格式不正确的HTML?
我尝试使用XOM和TagSoup,但是在创建Builder时出现以下错误:
11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder.
我必须安装Xerces才能使用XOM还是可以在没有XOM的情况下使用tagoup?
最佳答案
您可能会发现JTidy(http://jtidy.sourceforge.net/)-HTMLTidy的端口足够轻巧。根据要求输出XHTML