1. 什么是beatifulsoup?

beatifulsoup官网http://www.crummy.com/software/BeautifulSoup/ BeatifulSoup是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。 它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作。它可以大大节省你的编程时间。

2. 如何安装beatifulsoup?

从beatifulsoup的官网上找到下载链接,打到最新的新的版本下载到本地,然后安装。

$wget http://www.crummy.com/software/BeautifulSoup/bs4/download/4.3/beautifulsoup4-4.3.2.tar.gz
$tar zxvf beautifulsoup4-4.3.2.tar.gz
$cd beautifulsoup4-4.3.2
$python setup.py install
$python
>> from bs4 import BeautifulSoup

如果没有报错,即安装成功。

3. 如何使用

beautifulsoup的官网上有文档。http://www.crummy.com/software/BeautifulSoup/bs4/doc/  居然不家中文版!http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html

05-11 12:49