我正在尝试将基于Java的NLP“ RFTagger”实现为处理草图,以便分析推文。
如此处http://blog.blprnt.com/blog/blprnt/updated-quick-tutorial-processing-twitter所述使用Twitter4j
使用RFTagger分析推文:http://sifnos.sfs.uni-tuebingen.de/resource/A4/rftj/
为了过滤清晰的句子,我过滤掉所有的转发,主题标签和配置文件名称之后,将一个句子的单词存储在ArrayList中:
ArrayList<String> sentsTweet = new ArrayList<String>();
现在,我想由RFTagger分析该句子。我刚刚按照RFTagger网站上的描述实施了该库:
List <String> tags = rft.getTags(sentsTweet);
不幸的是,在处理中,类“列表”是未知/不可用(?)/错误消息:找不到名为“列表”的类或类型
我知道我可以将数据转换为其他易于管理的格式。像这样:
Object[] tags = (rft.getTags(sentsTweet)).toArray();
但是我需要按原样存储数据,以便第二次将其发送到RFTagger以使用其标签集转换器:
TagsetConverter conv = ConverterFactory.getConverter("stts");
List<String> sttsTags = new LinkedList<String>();
for ( String tag : tags ) {
sttsTags.add(conv.rftag2tag(tag));
}
现在,由于
List<String>
在“处理”中不起作用,您是否知道我如何处理RFTagger的数据和/或通信?亲切的问候,
马尔夫
最佳答案
这与处理库无关。RFTagger.getTags()
返回java.util.List
,它是JDK和JRE的一部分。您需要为List
类添加导入:
import java.util.List;