Anaconda入门教程

Anaconda是什么

Anaconda附带了 conda、Python 和 150 多个科学包及其依赖项。应用程序 conda 是包和环境管理器。Anaconda 的下载文件比较大(约 500 MB),因为它附带了 Python 中最常用的数据科学包。如果只需要某些包,或者需要节省带宽或存储空间,也可以使用 Miniconda 这个较小的发行版(仅包含 conda 和 Python)。但你仍可以使用 conda 来安装任何可用的包,它只是自身没有附带这些包而已。

Anaconda 附带了一大批常用数据科学包,因此你可以立即开始处理数据。其次,使用 conda 来管理包和环境能减少将来在处理数据过程中使用到的各种库与版本时遇到的问题。

更新所有的包

为了避免报错,我们可以在默认环境下更新所有的包。

打开 Anaconda Prompt (或者终端),键入:

conda upgrade --all

并在提示是否更新的时候输入 y(Yes)以便让更新继续。初次安装下的软件包版本一般都比较老旧,因此提前更新可以避免未来不必要的问题。

管理包

要安装包,请在终端中键入:

conda install package_name

例如,要安装 numpy,请键入

conda install numpy

还可以同时安装多个包。

conda install numpy scipy pandas

上面的命令会同时安装所有这些包。

conda install numpy=1.10

可以通过添加版本号来指定所需的包版本。

Conda 还会自动为你安装依赖项。例如,scipy 依赖于 numpy,因为它使用并需要 numpy。如果你只安装 scipy (conda install scipy),则 conda 还会安装 numpy(如果尚未安装的话)。

要卸载包,请使用

conda remove package_name

要更新包,使用

conda update package_name

想更新环境中的所有包(这样做常常很有用),使用

conda update --all

要列出已安装的包,使用

conda list

如果不知道要找的包的确切名称,可以尝试使用

conda search search_term

进行搜索。例如,我知道我想安装 Beautiful Soup,但我不清楚确切的包名称。因此,我尝试执行 。

conda search beautifulsoup

它返回可用的 Beautiful Soup 包的列表,并列出了相应的包名称 beautifulsoup4

管理环境

环境

conda 是虚拟环境管理器。类似于另外两个很流行的环境管理器,即 virtualenv 和 pyenv

环境能让你分隔用于不同项目的包。你常常要使用依赖于某个库的不同版本的代码。例如,你的代码可能使用了 Numpy 中的新功能,或者使用了已删除的旧功能。实际上,不可能同时安装两个 Numpy 版本。你要做的应该是,为每个 Numpy 版本创建一个环境,然后项目的对应环境中工作。

在应对 Python 2 和 Python 3 时,此问题也会常常发生。你可能会使用在 Python 3 中不能运行的旧代码,以及在 Python 2 中不能运行的新代码。同时安装两个版本可能会造成许多混乱和错误,而创建独立的环境会好很多。

你也可以将环境中的包列表导出为文件,然后将该文件与代码包括在一起。这能让其他人轻松加载代码的所有依赖项。pip 提供了类似的功能,即

pip freeze > requirements.txt

使用conda 管理环境

可以使用 conda 创建环境以隔离项目。

要创建环境,请在终端中使用

conda create -n env_name list of packages

-n env_name 设置环境的名称(-n 是指名称)

list of packages 是要安装在环境中的包的列表

例如,要创建名为 my_env 的环境并在其中安装 numpy,请键入 conda create -n my_env numpy

创建环境时,可以指定要安装在环境中的 Python 版本。这在你同时使用 Python 2.x 和 Python 3.x 中的代码时很有用。要创建具有特定 Python 版本的环境,请键入类似于 conda create -n py3 python=3 或 conda create -n py2 python=2 的命令。实际上,我在我的个人计算机上创建了这两个环境。我将它们用作与任何特定项目均无关的通用环境,以处理普通的工作(可轻松使用每个 Python 版本)。这些命令将分别安装 Python 3 和 Python 2 的最新版本。要安装特定版本(例如 Python 3.3),请使用 conda create -n py python=3.3

进入环境

创建了环境后,在 OSX/Linux 上使用 source activate my_env 进入环境。在 Windows 上,请使用 activate my_env

进入环境后,你会在终端提示符中看到环境名称,它类似于 (my_env) ~ $。环境中只安装了几个默认的包,以及你在创建它时安装的包。你可以使用 conda list 检查这一点。在环境中安装包的命令与前面一样:conda install package_name。不过,这次你安装的特定包仅在你进入环境后才可用。要离开环境,请键入 source deactivate(在 OSX/Linux 上)。在 Windows 上,请使用 deactivate

保存和加载环境

共享环境这项功能确实很有用,它能让其他人安装你的代码中使用的所有包,并确保这些包的版本正确。你可以使用 conda env export > environment.yaml 将包保存为 YAML。命令的第一部分 conda env export 用于输出环境中的所有包的名称(包括 Python 版本)。

列出环境

如果忘记了环境的名称,可以使用 conda env list 列出你创建的所有环境。你会看到环境的列表,而且你当前所在环境的旁边会有一个星号。默认的环境(即当你不在选定环境中时使用的环境)名为 root

删除环境

如果你不再使用某些环境,可以使用 conda env remove -n env_name 删除指定的环境(在这里名为 env_name)。

(课程学习笔记)

05-11 20:46