我正在用R
自学一些基本的表格Web抓取技术。但是我在运行功能readHTMLTable
时看到错误。
找不到签名““ NULL””的函数“ readHTMLTable”的继承方法
我专门尝试读取第二张表中的数据。我已经检查了页面源代码,以确保使用<table>
和<td>
格式化表格
release_table <- readHTMLTable("https://www.comichron.com/monthlycomicssales/1997/
1997-01.html", header=TRUE, which=2,stringsAsFactors=F)
我希望输出能够反映第二张表中的文本。
最佳答案
我们可以使用rvest
来获取所有表。
url <- "https://www.comichron.com/monthlycomicssales/1997/1997-01.html"
library(rvest)
tab <- url %>% read_html() %>% html_table()
我认为您正在寻找的是
tab[[1]]
或tab[[4]]
。