我有一个非常大的数据框,其中包含竞选财务数据-该数据框有一列用于候选人的委员会名称,但没有一列用于候选人的名称。

如何根据委员会名称自动为候选人名称添加新列?我希望代码读取每一行中的委员会名称,然后分配适当的候选人名称。

最佳答案

假设委员会名称和候选人名称之间存在一对一的映射,您可以在字典中进行描述,则只需使用map函数。

示例代码:

>>> import pandas as pd
>>> data  = pd.DataFrame([["A"], ["B"], ["A"], ["C"]], columns=["Committee Name"])
>>> data
  Committee Name
0              A
1              B
2              A
3              C
>>> committee_name_mapping = {"A": "AName", "B": "BName", "C": "CName"}
>>> data["Candidate Name"] = data["Committee Name"].map(committee_name_mapping)
>>> data
  Committee Name Candidate Name
0              A          AName
1              B          BName
2              A          AName
3              C          CName

09-25 22:22