我试图在已作为数据框打开的Excel文件中使用NLTK word_tokenize。我想在其上使用word_tokenize的列包含句子。如何从数据框中提取该特定列以对其进行标记?我尝试访问的列的名称称为“投诉/查询详细信息”。

import pandas as pd
from nltk import word_tokenize

file = "List of Complaints.xlsx"

df = pd.read_excel(file, sheet_name = "All Complaints" )

token = df["Complaint / Query Detail"].apply(word_tokenize)


我尝试了这种方法,但是却不断出错。

最佳答案

尝试这个:

df['Complaint / Query Detail'] = df.apply(lambda row:
    nltk.word_tokenize(row['Complaint / Query Detail']), axis=1)

关于python - 如何在数据框的单个列上使用Word token 化(Python),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52869456/

10-12 20:06