我正在尝试将基于Java的NLP“ RFTagger”实现为处理草图,以便分析推文。


如此处http://blog.blprnt.com/blog/blprnt/updated-quick-tutorial-processing-twitter所述使用Twitter4j
使用RFTagger分析推文:http://sifnos.sfs.uni-tuebingen.de/resource/A4/rftj/


为了过滤清晰的句子,我过滤掉所有的转发,主题标签和配置文件名称之后,将一个句子的单词存储在ArrayList中:

ArrayList<String> sentsTweet = new ArrayList<String>();


现在,我想由RFTagger分析该句子。我刚刚按照RFTagger网站上的描述实施了该库:

List <String> tags = rft.getTags(sentsTweet);


不幸的是,在处理中,类“列表”是未知/不可用(?)/错误消息:找不到名为“列表”的类或类型

我知道我可以将数据转换为其他易于管理的格式。像这样:

Object[] tags = (rft.getTags(sentsTweet)).toArray();


但是我需要按原样存储数据,以便第二次将其发送到RFTagger以使用其标签集转换器:

TagsetConverter conv = ConverterFactory.getConverter("stts");
List<String> sttsTags = new LinkedList<String>();
for ( String tag : tags ) {
    sttsTags.add(conv.rftag2tag(tag));
}


现在,由于List<String>在“处理”中不起作用,您是否知道我如何处理RFTagger的数据和/或通信?

亲切的问候,
马尔夫

最佳答案

这与处理库无关。

RFTagger.getTags()返回java.util.List,它是JDK和JRE的一部分。您需要为List类添加导入:

import java.util.List;

09-26 03:12