我正在尝试获取表的第一列中的所有链接here
我只能得到第一个链接/行。
library(rvest)
url <- "https://di.hkex.com.hk/di/NSSrchPersonList.aspx?sa1=pl&scsd=01/01/2018&sced=31/12/2018&pn=wing&src=MAIN&lang=EN"
l <- wahis.session %>%
html_nodes(xpath = '//*[@id="grdPaging"]') %>%
map_chr(~html_attr(html_node(., "a"), "href"))
l <- as.data.frame(l)
最佳答案
rvest支持nth-of-type伪类css选择器,因此您可以对具有指定id的表的第一列tds的子a
标记使用以下内容
library(rvest)
url <- "https://di.hkex.com.hk/di/NSSrchPersonList.aspx?sa1=pl&scsd=01/01/2018&sced=31/12/2018&pn=wing&src=MAIN&lang=EN"
links <- url %>%
read_html() %>%
html_nodes("#grdPaging td:nth-of-type(1) a") %>%
html_attr("href")