我想自动下载一个个人instagram页面,我想使用命令wget下载整个页面,但是它不起作用。

我设置了标头(浏览器使用的标头)和cookie(采用cookie.txt扩展名),因此整个命令行为:

wget -x -U "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36" --load-cookies cookies.txt -r "https://instagram.com/username"

但是结果是带有instagram徽标的白页。
你还有其他主意吗?还有另一种方法可以实现这一目标吗?
我认为该请求是正确的,也许instagram使用带有javascript或类似内容的动态请求,但我遵循的是错误的方法,但是如果的确如此,当我在浏览器中打开页面时,这应该执行javascript代码。它是否正确?

最佳答案

wget不是Web浏览器。特别是,它不理解JavaScript,Instagram的用户页面的大部分内容都是通过JavaScript生成的,所以这是您的第一个问题。

您的第二个问题是Instagram's bot policy禁止使用wget,并且很可能即使更改了用户代理,它们也有措施检测wget-存在companies which specialize in that

关于linux - 如何使用wget自动下载Instagram页面,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57236012/

10-16 10:41
查看更多