我试图在已作为数据框打开的Excel文件中使用NLTK word_tokenize。我想在其上使用word_tokenize的列包含句子。如何从数据框中提取该特定列以对其进行标记?我尝试访问的列的名称称为“投诉/查询详细信息”。
import pandas as pd
from nltk import word_tokenize
file = "List of Complaints.xlsx"
df = pd.read_excel(file, sheet_name = "All Complaints" )
token = df["Complaint / Query Detail"].apply(word_tokenize)
我尝试了这种方法,但是却不断出错。
最佳答案
尝试这个:
df['Complaint / Query Detail'] = df.apply(lambda row:
nltk.word_tokenize(row['Complaint / Query Detail']), axis=1)
关于python - 如何在数据框的单个列上使用Word token 化(Python),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52869456/