我使用rvest抓取Web数据。
我从网站上获得了以下CSS代码:
<abbr class="intabbr" title="2.856.890">2,9M</abbr>
我用这个刮
library(rvest)
library(dplyr)
n <- read_html("https://www.last.fm/de/music/Fang+Island")
n %>%
html_node("abbr") %>%
html_text()
这给了我“ 2M”,但是我想得到的是“ 2.856.890”。
我对CSS不太了解:是否可以通过更改html_node()中的表达式来获取所需的信息?
This post提示不可能,但是this one提示可能,因为它作为工具提示弹出在页面上?
最佳答案
使用html_attr
获取标签的属性:
n %>%
html_node("abbr") %>%
html_attr("title")