我有两个看起来像这样的CSV文件。

CSV 1

reference  |  name  |  house
----------------------------
2348A      |  john  |  37
5648R      |  bill  |  3
RT48       |  kate  |  88
76A        |  harry |  433


CSV2

reference
---------
2348A
76A


使用Python和CSVkit,我试图通过将CSV1中的行与CSV2进行比较来创建输出CSV。有人能为我指出方向吗?

最佳答案

我建议使用pandas来实现您想要的目标:

这就是使用熊猫的简单程度,请考虑您的两个csv文件是这样的:


  CSV1


reference,name,house
2348A,john,37
5648R,bill,3
RT48,kate,88
76A,harry ,433



  CSV2


reference
2348A
76A



  码


import pandas as pd
df1 = pd.read_csv(r'd:\temp\data1.csv')
df2 = pd.read_csv(r'd:\temp\data2.csv')
df3 = pd.merge(df1,df2, on= 'reference', how='inner')
df3.to_csv('outpt.csv')



  output.csv


,reference,name,house
0,2348A,john,37
1,76A,harry ,433

10-07 20:24