学数据分析当然要先有数据,数据是分析的根本,不然一切都是空谈。如果是在公司里,得到数据轻而易举,因为公司有客户,有业务,必然会产生大量数据。但仅仅是个人学习的话,我们如何得到数据呢?
其实这也是好多正在学习数据分析的朋友常会遇到一个问题。一些朋友可能说爬虫可以解决。没错,确实可以通过爬虫来获取一部分信息,但也有局限性,并且每次都爬不但麻烦,也会遇到很多问题,毕竟我们的重点是分析而不是爬虫。
下面博主将珍藏的一些网上公开数据源做一个汇总,帮助有需要数据的朋友们。
1
机器学习/数据挖掘
加\/X:mmp9972 即可获取数十套PDF哦!
1. 1 Kaggle
- https://www.kaggle.com/
1.2 天池
- https://tianchi.aliyun.com/
1.3 数据城堡(DataCastle)
- http://www.pkbigdata.com/
1.4 SofaSofa
- http://sofasofa.io/index.php
2
各行业的数据网站
2.1 世界宏观经济数据
- https://knoema.com/
- https://data.worldbank.org.cn/
2.2 国家统计局
- https://www.stats.gov.cn/
2.3 CEIC
- http://www.ceicdata.com/zh-hans
2.4 万得(Wind)
- http://www.wind.com.cn/
2.5 搜数网
- http://www.soshoo.com/
2.6 中国统计信息网
- http://www.tjcn.org/
2.7 figshare
- https://figshare.com/
2.8 OpenStreetMap
- https://www.openstreetmap.org/
2.9 极海(geohey)
- https://geohey.com/
2.10 github
- https://github.com/caesar0301/awesome-public-datasets
3
总结
其实数据是无处不在的,需要我们平时善于发现和观察。以上是本次向大家分享的免费数据网站,希望对大家能有所帮助。