首先去http://nltk.org/install.html下载相关的安装程序,然后
在cmd窗口中,进入到python的文件夹内的 Scripts内,运行easy_install pip
安装PyYAML and NLTK:pip install pyyaml nltk
这样就将nltk安装完成,安完可以测试下。
然后敲入下面的代码,进入NLTK数据源下载界面:
import nltk
nltk.download()
选择all,设置好下载路径(Download Directory),然后点击Download,系统就开始下载NLTK的数据包了,下载的时间比较漫长,大家要耐心等待。如果有个别数据包无法下载,你可以切换到All Packages标签页,双击指定的包来进行下载:
如果都不行的话,你还可以直接到 http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml 去下载数据包,只要将数据包复制到你的Download Directory目录下即可。
安装NLTK
form nltk.book import *
键入以上代码可以得到图中的显示,就说明NLTK数据包都安装好了~
实践。使用NLTK进行字符串查询
text1.concordance('monstrous')
说明:
text1为NLTK数据包中的一段数据源,是一大串字符串。(原文在数据包下载目录下的gutenberg.zip中的melville-moby_dick.txt)
text1.concordance('monstrous')这句话实现的是从这一大串字符串中找寻出包含monstrous这个单词的语句。