为什么youtube.com的页面源无法抓取?
我尝试了以下操作(将phantomjs以及chrome与Selenium服务器一起使用)
library(RSelenium)
pJS <- phantom(pjs_cmd = ...)
Sys.sleep(5) # give the binary a moment
remDr <- remoteDriver(browserName = 'phantomjs')
remDr$open()
remDr$navigate("https://www.youtube.com/")
remDr$getTitle()[[1]] # [1] "YouTube"
remDr$getPageSource()
返回值:
Error in fromJSON(content, handler, default.size, depth, allowComments, :
invalid JSON input
最佳答案
它与编码有关。现在使用开发版本,直到下一个版本发布到CRAN:
devtools::install_github("ropensci/RSelenium")