当我用htmlUnit运行page.asxml()时,我会丢失页面的doctype。有工作吗?
注:目的是为谷歌提供dom服务。

最佳答案

尝试呼叫

p.getWebResponse().getContentAsString()

而不是
p.asXml()

我刚试过对付http://google.com,在前一种情况下““仍保留在输出中。

10-07 23:54