为什么youtube.com的页面源无法抓取?

我尝试了以下操作(将phantomjs以及chrome与Selenium服务器一起使用)

library(RSelenium)
pJS <- phantom(pjs_cmd = ...)
Sys.sleep(5) # give the binary a moment
remDr <- remoteDriver(browserName = 'phantomjs')
remDr$open()
remDr$navigate("https://www.youtube.com/")
remDr$getTitle()[[1]] # [1] "YouTube"
remDr$getPageSource()

返回值:
Error in fromJSON(content, handler, default.size, depth, allowComments,  :
  invalid JSON input

最佳答案

它与编码有关。现在使用开发版本,直到下一个版本发布到CRAN:

devtools::install_github("ropensci/RSelenium")

07-24 19:08