如何轻松地提取仅嵌入在HTML页面内的网页内容(例如img,pdf,flv,doc,rtf,wmc等),而不是css和css背景图像,javascript。我正在将内容旧站点迁移到新站点。重新上传所有图像,链接的pdf,flv等。 最佳答案 如果您使用过XHTML,则可以使用普通的XML解析器。