我想从文本中获取所有类型的名词,如何获得?

import edu.stanford.nlp.tagger.maxent.MaxentTagger;
import java.io.BufferedReader;
import java.io.FileReader;


public class Noun_Code {


    public static void main(String[] args) {
        try{

            FileReader file = new FileReader("C:\\Users\\NaB33L NaQ33B!\\Desktop\\TaggerDemo.java");
            @SuppressWarnings("resource")
            BufferedReader reader = new BufferedReader(file);

            String text = "";
            String line = reader.readLine();
            while(line!=null){
                text +=line;
                line = reader.readLine();
            }
            System.out.println(text);
            String tagged;

            MaxentTagger LibAddress =  new MaxentTagger("F:\\stanford-postagger-2015-04-20\\stanford-postagger-2015-04-20\\models/english-left3words-distsim.tagger");
            tagged = LibAddress.tagString(text);

            System.out.println("Frequency : "+tagged);

            String[] words = tagged.split(" ");

            String[] keyword1 = new String[words.length];
            int len=keyword1.length;
        for(int i = 0;i<words.length;i++)
        {
            int length= words[i].length();
            char chr1 = (char) (words[i].charAt(length-3));
            char chr2 = (char) (words[i].charAt(length-2));
            char chr3 = (char) (words[i].charAt(length-1));
            if(chr1=='N' && chr2=='N' && chr3=='P')
            {
            keyword1[i] = words[i];
            System.out.println(keyword1[i]);
            }
            else
            {
            keyword1[i] = "-1";
            }
        }
            int var =0;
        for(int i = 0;i<keyword1.length;i++)
        {
            if(keyword1[i].equalsIgnoreCase("-1"))
            {
            var=var+1;
            }
        }
            len=len-var;
            String[] original = new String[len];
            String[] temp = new String[len];
            int e=0;
        for(int i = 0;i<keyword1.length;i++)
        {
            if(keyword1[i].equalsIgnoreCase("-1")){}
            else
            {original[e] = keyword1[i];
            temp[e] = keyword1[i];
            e=e+1;
            }
        }
        }
        catch(Exception ex){System.out.println("Exception :"+ex);}
}
}

请指导我,以获取所有类型的名词。以上是我正在使用的所有代码。我想要以下所有名词类型:
常用名词
普通名词是指一般意义上的人或物的名词。男孩,国家,桥梁,城市,出生,日子,幸福。

专有名词
专有名词是标识特定人,地点或事物的名称,例如斯蒂芬,非洲,伦敦,星期一。在书面英语中,专有名词以大写字母开头。

具体名词
一个具体的名词是一个名词,指的是人类和事物的物理存在,可以看到,触摸,闻到,听到或品尝。例如狗,建筑物,咖啡,树,雨,海滩,曲调。

抽象名词
抽象名词是指意念,品质和条件的名词-看不见或触及的事物以及没有物理现实的事物,例如真理,危险,幸福,时间,友谊,幽默。

集合名词
集合名词指的是一群人或事物,例如观众,家庭,政府,团队,陪审团。在美式英语中,大多数集体名词都被视为单数形式,并带有单数动词:整个家庭都在餐桌旁。

最佳答案

我相信您将需要词典中所有现有名词的列表。然后,您只需在字符串上搜索它们中的每个。

您可能可以在下面的链接中使用该列表。它包含4554个名词。

http://www.desiquintans.com/nounlist

关于java - 如何在Java中提取所有类型的名词?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48711753/

10-12 20:49