我正在尝试从以下列表构建数据框:

A = ['item 1', 'item 2', 'item 3', 'item 4', 'item 5']

B = ['item 2','item 4']

C = ['item 1', 'item 5']


我希望列表名称(或该名称的某种表示形式)为相应的值,例如:

dA = [{'item':x, 'A':True} for x in A]
dB = [{'item':x, 'B':True} for x in B]
dC = [{'item':x, 'C':True} for x in C]


目前,我正在使用一些难看的方法来构建数据框。我很喜欢这里的最佳做法解决方案:

dfA = pd.DataFrame.from_records(dA)
dfB = pd.DataFrame.from_records(dB)
dfC = pd.DataFrame.from_records(dC)

df = pd.merge(dfA,dfB, 'outer').merge(dfC,'outer').fillna(False)

# Result:
    item    A   B   C
0   item 1  True    False   True
1   item 2  True    True    False
2   item 3  True    False   False
3   item 4  True    True    False
4   item 5  True    False   True

最佳答案

无需合并的另一种方法

import pandas as pd

# list all unique items (in case there are not all present in A)
all_items = list(set(A+ B+C))
# create a dataframe with only item column
df = pd.DataFrame({'item':all_items})
# add boolean columns
df['A'] = df['item'].isin(A)
df['B'] = df['item'].isin(B)
df['C'] = df['item'].isin(C)

#   item    A   B   C
#0  item 4  True    True    False
#1  item 3  True    False   False
#2  item 2  True    True    False
#3  item 1  True    False   True
#4  item 5  True    False   True


如果您想要更漂亮的东西或要创建更多的列,也可以使用字典

dict_list = {'A': A, 'B': B, 'C':C}
for col in dict_list.keys():
  df[col] = df['item'].isin(dict_list[col])

关于python - 使用基于列表名称的逻辑将列表转换为DataFrame,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58600154/

10-11 19:38
查看更多