本文介绍了将 SpaCy 的 EntityRecognizer 应用于 Pandas 数据框中的列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个基于文本的数据集,我希望将 SpaCy 的 EntityRecognizer 应用于特定列的每一行.
I have a text based dataset where I am looking to apply SpaCy's EntityRecognizer to each row for a specific column.
我可以通过执行以下操作来应用一般的 spaCy 管道:
I can apply the general spaCy pipeline by doing something like this:
df['new_col'] = df['col'].apply(lambda x: nlp(x))
df['new_col'] = df['col'].apply(lambda x: nlp(x))
如何仅应用实体识别器并获取其值?
How do I just apply just the entity recongnizer and get its values?
推荐答案
在 Spacy 中,文档有一个属性 .ents
巫婆在其命名实体上返回一个生成器.
In Spacy a doc have a attribute .ents
witch return a generator on its named entities.
所以你可以使用:
df['new_col'] = df['col'].apply(lambda x: list(nlp(x).ents))
这篇关于将 SpaCy 的 EntityRecognizer 应用于 Pandas 数据框中的列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!