假设我有以下网址:
http://linkinghub.elsevier.com/retrieve/pii/S1755534516300379
在我的标准桌面浏览器中输入它时,我被重定向到:
http://www.sciencedirect.com/science/article/pii/S1755534516300379?via%3Dihub
但是,我无法在 R 中实现它。我尝试了 httr 和 RCurl 包。在 httr 的文档中,它说函数 GET 使用如下:
library(httr)
GET("http://linkinghub.elsevier.com/retrieve/pii/S1755534516300379")
应该导致使用的实际网址(在任何重定向之后)。但是在调用 url 时:
GET("http://linkinghub.elsevier.com/retrieve/pii/S1755534516300379")$url
我没有得到最终的重定向。我非常感谢您的帮助!
最佳答案
此站点的重定向使用 javascript,而不是 http。因此,除非您解释下载文档的内容,否则重定向将不起作用。
如果您想解析来自同一站点的多个文档,您可以直接从文档解析重定向 url。
如果您想使用不同的重定向机制解析许多不同的站点,您将需要一些实际加载站点并运行 javascript 的库,例如 RSelenium
。
关于r - 如何跟踪 R 中 url 的任何重定向?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46844817/