我已经搜索了一段时间,但没有找到任何关于此的信息。
我遇到以下问题:
我想训练一个模型,在该模型中输入一个自定义BIO标签。例如,对于输入“我父亲住在曼哈顿,他的名字叫安东尼·克拉克”,以及LOC和PER类,输出必须为:
[(My, O),(dad,O), (lives, O), (in,O), (Manhattan, B-LOC), (, , O), (his,O), (name,O), (is,O), (Anthony, B-PER), (Clark,I-PER)]
NTLK有可能吗?我应该包括哪些功能?
最佳答案
我发现我不需要NLTK。但POS标记器作为培训的功能将非常有用。
有比使用默认的NLTK PO标记器更好的选项,例如Stanford Tagger或Freeling。
关于python - 使用NLTK训练自定义BIO标签,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/50408720/