- Rvest 包中常用函数一览:
read_html() | 读取 html 页面 |
html_nodes() | 提取所有符合条件的节点 |
html_node() | 返回一个变量长度相等的list,相当于对html_nodes() 取[[1]] 操作 |
html_table() | 获取 table 标签中的表格,默认参数trim=T ,设置header=T 可以包含表头,返回数据框 |
html_text() | 提取标签包含的文本,令参数trim=T ,可以去除首尾的空格 |
html_attrs(nodes) | 提取指定节点所有属性及其对应的属性值,返回list |
html_attr(nodes,attr) | 提取节点某个属性的属性值 |
html_children() | 提取某个节点的孩子节点 |
html_session() | 创建会话 |