我从CoreNLP以.conll
格式输出了一些文件,我想将它们反序列化为Annotation
对象。 CoreNLP是否提供CONLL-X DocumentReader
方法将.conll
文件转换为Annotation
对象,还是我必须创建自己的DocumentReader?
最佳答案
您可以尝试使用TSVSentenceIterator之类的方法,该方法从类似CoNLL格式的TSV文件中读取句子。
但是,请注意,悬挂在Annotation对象上的Annotations的数量远远大于CoNLL文件中的列数(例如,字符偏移量等),因此此序列化不会无损,并且可能具有意外行为如果您想继续注释对象。这不是官方支持的无损序列化策略之一。