机器学习常用到python的自然语言处理框架NLTK,这个是机器学习的常用包,在使用过程中会遇到不少问题。我会和大家分享在这其中的一些经验。

今天闲来说一下安装,在安装中出现的download错误。


>>> import nltk

>>> nltk.download()

NLTK Downloader

---------------------------------------------------------------------------

d) Download l) List c) Config h) Help q) Quit

---------------------------------------------------------------------------

Downloader> l

Packages:

Error connecting to server: [Errno -2] Name or service not known

经过推测,是服务器无法连接下载服务器地址导致的。

查看一下nltk download配置

Downloader> c

Data Server:

- URL:

- 3 Package Collections Available

- 74 Individual Packages Available

Local Machine:

- Data directory: /home/wym/nltk_data

然后

> curl http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml

报错:curl: (6) Couldn't resolve host 'nltk.googlecode.com'

google的地址肯定是被墙掉了(唉,大家懂的)

解决办法:

修改dns地址,

> vim /etc/resolv.conf

修改nameserver为: nameserver 8.8.8.8

问题解决


09-03 15:01