我尝试从用户提供的 URL 开始递归镜像网页(当然有深度限制)。 Wget 没有捕获来自 css/js 的链接,所以我决定使用 httrack

我尝试镜像这样的网站:

# httrack <http://onet.pl> -r6 --ext-depth=6 -O ./a "+*"

本网站使用重定向(301)到 http://www.onet.pl:80 , httrack 只是
下载 index.html 页面:
<a HREF="onet.pl/index.html" >Page has moved</a>

仅此而已!当我运行时:
# httrack <http://www.onet.pl> -r6 --ext-depth=6 -O ./a "+*"

它做我想要的。

有没有办法让 httrack 跟随重定向?目前我只是将 "www."+url 添加到 httrack 的 URL 中,但这不是一个真正的解决方案(不包括所有用户案例)。有没有更好的Linux网站镜像工具?

最佳答案

在主 httrack forum 上,一位开发人员说这是不可能的。

正确的解决方案是使用另一个网络镜像工具。

关于unix - httrack 跟随重定向,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/11917794/

10-09 18:12