请不要立即标记我的答案,因为我搜索了其他无法解决问题的问题,例如this.

我正在尝试从csv文件生成一组python字符串。加载的csv文件的打印的熊猫数据帧具有以下结构:

   0
0  me
1  yes
2  it


对于项目,我需要将此格式设置为如下所示

STOPWORDS = {'me', 'yes', 'it'}


我试图通过以下代码来做到这一点。

import pandas as pd

df_stopwords = pd.read_csv("C:/Users/Jakob/stopwords.csv", encoding = 'iso8859-15', header=-1)

STOPWORDS = {}
for index, row in df_stopwords.iterrows():
    STOPWORDS.update(str(row))

print(STOPWORDS)


但是,我收到此错误:

dictionary update sequence element #0 has length 1; 2 is required


当我使用STOPWORDS.update(str(row))时,出现以下错误:

'dict' object has no attribute 'add'


谢谢大家!

最佳答案

您可以使用以下命令直接从数据框中的值创建set

set(df.values.ravel())
{'me', 'yes', 'it'}

10-06 12:44