1. 什么是beatifulsoup?
beatifulsoup官网http://www.crummy.com/software/BeautifulSoup/ BeatifulSoup是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。 它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作。它可以大大节省你的编程时间。
2. 如何安装beatifulsoup?
从beatifulsoup的官网上找到下载链接,打到最新的新的版本下载到本地,然后安装。
$wget http://www.crummy.com/software/BeautifulSoup/bs4/download/4.3/beautifulsoup4-4.3.2.tar.gz
$tar zxvf beautifulsoup4-4.3.2.tar.gz
$cd beautifulsoup4-4.3.2
$python setup.py install
$python
>> from bs4 import BeautifulSoup
如果没有报错,即安装成功。
3. 如何使用
beautifulsoup的官网上有文档。http://www.crummy.com/software/BeautifulSoup/bs4/doc/ 居然不家中文版!http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html