本文介绍了如何为stanford tagger创建自己的训练语料库?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我必须用很多简短的手和当地的术语来分析非正式的英文文本。因此,我正在考虑为stanford标记创建模型。

I have to analyze informal english text with lots of short hands and local lingo. Hence I was thinking of creating the model for the stanford tagger.

如何为stanford标记创建我自己的标记语料库集?

How do i create my own set of labelled corpus for the stanford tagger to train on?

语料库的语法是什么?我的语料库需要多长时间才能达到理想的性能?

What is the syntax of the corpus and how long should my corpus be in order to achieve a desirable performance?

推荐答案

要训练PoS标记器,请参阅也包含在。

To train the PoS tagger, see this mailing list post which is also included in the JavaDocs for the MaxentTagger class.

指定培训格式:

这篇关于如何为stanford tagger创建自己的训练语料库?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

09-18 16:41