我想在 Pandas 数据框中创建一个新列。第一列包含国家/地区名称。该列表包含我感兴趣的国家(例如欧盟)。新列应指示数据框中的国家/地区是否在列表中。
以下是代码的缩短版本:

import pandas as pd
import numpy as np

EU = ["Austria","Belgium","Germany"]

df1 = pd.DataFrame(data={"Country":["USA","Germany","Russia","Poland"], "Capital":["Washington","Berlin","Moscow","Warsaw"]})

df1["EU"] = np.where(df1["Country"] in EU, "EU", "Other")
我得到的错误是:ValueError: Series 的真值不明确。使用 a.empty, a.bool(), a.item(), a.any()a.all()我不知道问题是什么以及如何解决它。我错过了什么?
我在 Windows 上使用 Anaconda。
谢谢

最佳答案

使用 isin 检查成员(member)资格:

df1["EU"] = np.where(df1["Country"].isin(EU), "EU", "Other")
print (df1)
      Capital  Country     EU
0  Washington      USA  Other
1      Berlin  Germany     EU
2      Moscow   Russia  Other
3      Warsaw   Poland     EU

关于Python pandas - 如果项目在列表中,则新列的值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/45184549/

10-14 12:07