HanLP中文自然语言处理工具实例演练
作者:白宁超
2016年11月25日13:45:13
目录
1 MyEclipse安装HanLP
【注】:本文主注重方法调用和操作,后续文章注重原理和源码分析。
具体操作扩展步骤参看官方文档,本文是作者操作记录,便于实际应用。HanLP将数据与程序分离,给予用户自定义的自由。 HanLP由三部分组成:HanLP = .jar + data + .properties ,请前往 项目主页 下载这三个部分。
1 其中jar、data.zip、hanlp.properties是安装配置文件,橘色框为源码。
2 打开MyEclipse新建项目HanLP,将jar放入lib包并构建依赖,data.zip、hanlp.properties均放入HanLP主目录下。
3 hanlp.properties进行修改,只需要改root=yourpath/HanLP即可
4 将修改后的hanlp.properties放入工作空间中 HanLP/bin下一份即可完成
5 测试分词:
如上即在MyEclipse下完成HanLP安装,需要什么功能,只需要HanLP点就可以提示基本功能。这里说明一点,data下面model主要用于句法分析的,默认情况下原作者将其分割开了,需要的自行下载即可。