我一直在尝试使用httrack镜像一个页面(下载html+先决条件:样式表、图像等),类似于问题[mirror single page with httrack][1]。但是,对于我来说,所接受的答案对我不起作用,因为我使用Windows(其中wget
)存在,但实际上是Invoke-WebRequest
的包装器,并且不以相同的方式起作用。
httrack真的想(a)下载我指向的整个网站,或者(b)只下载我指向的页面,让所有图片仍然存在于网络上。有没有一种方法可以使httrack下载仅足以在脱机状态下正确查看单个页面,相当于wget -p
?
最佳答案
这是一篇老文章,所以你现在可能已经知道了。我刚刚看到你的帖子,想寻找关于使用python和httrack的另一个答案。我遇到了和你一样的问题,我通过了参数r2,它下载了图像。
我的论点基本上是这样的:
cmd=[httrack,myurl,'-%v','-r2','-f',“Mozilla/5.0(Windows NT 6.1;Win64;x64)”,'-o',存储位置]