- NumPy
NumPy是构建科学计算的最基础的包。它提供了对 n 维数组和矩阵的操作的强力支持。该库还提供了 NumPy 数组类型的数学运算向量化,可以提升性能,从而加快执行速度。
- SciPy
SciPy 是一个工程和科学软件库, 包含线性代数、优化、集成和统计的模块。SciPy 库的主要功能建立在 NumPy 的基础之上,它通过其特定的子模块提供高效的数值例程操作。
- Pandas
Pandas是一个 Python 包,旨在通过「标记(labeled)」和「关系(relational)」数据进行工作,简单直观。Pandas 是 data wrangling 的完美工具。它设计用于快速简单的数据操作、聚合和可视化。
- Seaborn
Seaborn 主要关注统计模型的可视化。这种可视化包括热度图(heat map),可以总结数据但也描绘总体分布。Seaborn 基于 Matplotlib,并高度依赖于它。
- Bokeh
Bokeh是一个很好的可视化库,其目的是交互式可视化,不过这个库独立于 Matplotlib,它通过现代浏览器以数据驱动文档(D3.js)的风格呈现。
- Scikits
Scikits 是 SciPy Stack 的附加软件包,专为特定功能(如图像处理和辅助机器学习)而设计。其中最突出的一个是 scikit-learn。该软件包构建于 SciPy 之上,并大量使用其数学操作,是使用 Python 进行机器学习的实际上的行业标准。
- Theano
Theano 是一个 Python 包,它定义了与 NumPy 类似的多维数组,以及数学运算和表达式。该库是经过编译的,使其在所有架构上能够高效运行。这个库最初由蒙特利尔大学机器学习组开发,主要是为了满足机器学习的需求。
- Keras
Keras是一个使用高层接口构建神经网络的开源库,它是用 Python 编写的。它简单易懂,具有高级可扩展性。Keras 极其容易上手,而且可以进行快速的原型设计,足以用于严肃的建模。
- Gensim
Gensim是一个用于 Python 的开源库,实现了用于向量空间建模和主题建模的工具。
- Scrapy
Scrapy 是用于从网络检索结构化数据的爬虫程序的库。它现在已经发展成了一个完整的框架,可以从 API 收集数据,也可以用作通用的爬虫,因此可以用来开发和扩展大型爬虫。
01-30 18:55