项目简介:

编写Python脚本爬取某租房网站的房源信息,利用高德的 js API 在地图上标出房源地点,划出距离工作地点1小时内可到达的范围,附上公交路径规划功能查看不同路径的用时。

一、介绍

1.背景

项目来自一段租房血泪史(夸张):事情是这样的,笔者是接着念大四准备考研,而室友是应届毕业在找工作,说白了就是都没有钱,于是打算合租。因为穷所以不可能找有门店的的中介,只能看看赶集、58 和一些租房APP。期间需要考虑两个人的通勤范围来选地段,由于对交通的不熟悉,只有选择自己附近的较贵的地段,花了很多时间阅览赶集或者58里的个人房源信息,然而个人房源信息中仍充斥着大量中介,抱着一点希望打了几个电话,得到的回答都是这个价位根本租不到,再高点也租不到(大都与发布的房源信息不符)。最后终于还是在宿舍关闭前一个星期租到一个性价比还可以的隔断。毕竟隔断还是不方便的,所以打算在室友找到工作后换一个新地方,于是就有了这个租房脚本和教程。(教程地址:https://www.shiyanlou.com/courses/599)

相信也有不少的应届毕业生可能会遭遇同样的境况,希望这个教程真的能帮到大家,也许不仅是在租房方面。

总结一下租房难的症结:

1.没钱

2.小中介发布的价位一般都是假的,会浪费你很多时间

3.对交通路线不熟悉以致于选择面窄

4.如果是多人,得同时考虑多人的通勤时间

本教程将解决的问题:

1.学习了技术,增长了知识,就能找到好工作,找到好工作就能有钱

2.这次选的房源信息来自58的品牌公寓馆,所以没有那种小中介,价位就我和我室友来说可以接受。其实可以做个分类器过滤赶集上的中介来找低价个人房源的,有需要的同学可以试一下

3.通勤范围在地图上圈出,解决了对交通路线不熟悉的问题

4.本课程是单人版的,但代码中只要删掉一个语句就能当多人用了(但是路径规划的功能是只能给一个人用)。如果是直接拿来多人用的话,还是开多个页面比较好

最终效果图如下:

高德 API+Python 解决租房问题-LMLPHP

由于没做前端兼容,导致右上角崩了。自用的小工具其实也不用整多好看,效率第一。

如图,划出来的大片蓝色色块就是距离工作地点一小时车程内的区域。蓝色的标记就是房源,点击后会自动给出路径规划和房源地址。红色标记(不是"终")是工作地点,在图里被挡住了。工作地点的输入框有自动补完的功能,也是很方便的。至于房源文件我们会通过编写Python脚本在抓取房源信息后生成。

2. 知识点

本教程项目完成过程中,我们将学习:

1.requests、BeautifulSoup、csv 等库的简单使用

2.高德地图 Javascript API 的使用

二、实验环境

打开终端,进入 Code 目录,创建 rent_proj 文件夹, 并将其作为我们的工作目录。

$ cd Code
$ mkdir rent_proj && cd rent_proj

安装需要的库:

$ sudo apt-get install python-bs4

三、实验原理

实验中会用到三个文件:crawl.py,rent.csv与index.html,其中rent.csv由crawl.py生成,是房源文件。crawl.py是一个非常简单的爬取网页的脚本。

index.html是最重要的显示地图的部分。实现的流程大致如下:

高德 API+Python 解决租房问题-LMLPHP

我为什么不把js代码和css代码从index.html中分出来呢,写脚本怎么顺手怎么来就好。

四、效果演示

首先选择工作地点,划出了一小时内的通勤范围:

高德 API+Python 解决租房问题-LMLPHP

北京堵车太猖狂,可能还是地铁保险:

高德 API+Python 解决租房问题-LMLPHP

导入房源文件后:

高德 API+Python 解决租房问题-LMLPHP

选择一处房源,会自动帮你规划路径:

高德 API+Python 解决租房问题-LMLPHP

选中房源地址跳转到目标页面:

高德 API+Python 解决租房问题-LMLPHP

作者:Wayne Shi
来源:知乎
商业转载请联系作者获得授权,非商业转载请注明出处

Python学习交流群:238757010

05-11 20:54