我正在用R自学一些基本的表格Web抓取技术。但是我在运行功能readHTMLTable时看到错误。


找不到签名““ NULL””的函数“ readHTMLTable”的继承方法


我专门尝试读取第二张表中的数据。我已经检查了页面源代码,以确保使用<table><td>格式化表格

release_table <- readHTMLTable("https://www.comichron.com/monthlycomicssales/1997/
                               1997-01.html", header=TRUE, which=2,stringsAsFactors=F)


我希望输出能够反映第二张表中的文本。

最佳答案

我们可以使用rvest来获取所有表。

url <- "https://www.comichron.com/monthlycomicssales/1997/1997-01.html"
library(rvest)
tab <- url %>%  read_html() %>%  html_table()


我认为您正在寻找的是tab[[1]]tab[[4]]

10-05 20:39