我从CoreNLP以.conll格式输出了一些文件,我想将它们反序列化为Annotation对象。 CoreNLP是否提供CONLL-X DocumentReader方法将.conll文件转换为Annotation对象,还是我必须创建自己的DocumentReader?

最佳答案

您可以尝试使用TSVSentenceIterator之类的方法,该方法从类似CoNLL格式的TSV文件中读取句子。

但是,请注意,悬挂在Annotation对象上的Annotations的数量远远大于CoNLL文件中的列数(例如,字符偏移量等),因此此序列化不会无损,并且可能具有意外行为如果您想继续注释对象。这不是官方支持的无损序列化策略之一。

07-24 09:39