我有两个巨大的CSV文件,希望它们使用python pandas加入一个新的CSV文件中,主键是id_student,可以将不同的列成功地连接在一起,但是当我输出到一个新的CSV文件中时,的数据将仅存在于第一行,不同的列,例如,第1行的第1列将是id_student,就像:

0  12345
1  12344


那么第1行的列将是final_result,格式如下:

0  Pass
1  Pass


但我的预期输出将是:

0  12345 Pass
1  12344 Pass


有什么办法可以修复输出格式?

def plotlyGraph(self):

    df = pandas.read_csv('studentAssessment.csv')
    dc = pandas.read_csv('studentInfo.csv')
    res = pandas.merge(df,dc, on=['id_student'], how='outer')
    a=res['id_student']
    b=res['final_result']
    c=res['score']
    d=res['id_assessment']
    e=res['region']

    with open("new.csv", "w", newline="") as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow([a,b,c,d,e])

最佳答案

我假设您的df有2列:id_studentid_assessment,而dc有2列:id_studentfinal_result。试试这个:

df = pandas.read_csv('studentAssessment.csv')
dc = pandas.read_csv('studentInfo.csv')

res = df.merge(dc, on=['id_student'], how='outer')
print(res)


输出量

   id_student id_assessment final_result
0           0       12345          pass
1           1       12344          pass


要存储在csv文件中:

res.to_csv("new.csv", index=False)

关于python - 如何使用一个主键将不同的CSV文件合并为新的CSV文件,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55755739/

10-12 23:27