我目前正在熊猫的数据框架工作。总之,我有一个称为“索赔”的数据框,里面有客户索赔数据,我想基于字段'Part ID'中找到的唯一值来解析数据框中的所有行。然后我想获取每一组行,并一次将其追加到一个名为“emptydf”的空数据框中。这个数据框与“Claims”数据框具有相同的列标题。由于“Part ID”列中的值每周都有变化,所以我希望找到一些动态的方法,而不是每周手动梳理数据帧。我想用某种方式合并df.where()表达式和For循环,但不知如何将它们组合在一起。任何关于如何进行这项工作的见解,甚至是一些更好的方法,都将是伟大的!到目前为止,我的代码分为以下两个步骤:
emptydf=索赔[0:0]
#创建空数据帧
2.Parse_Claims=Claims.query('Part_ID==1009')
emptydf=emptydf.append(解析声明)
#按每个唯一的部件ID号分析数据帧并追加到空数据帧。如您所见,到目前为止,我一次只能硬编码一个部件ID号。这需要几个小时来手动完成,所以我想找出一种方法来遍历Part ID列并动态地追加数据。
不用说,我对Python非常陌生,所以我非常感谢您的耐心!
最佳答案
empty_df = list(Claims.groupby(Claims['Part_ID']))
这将创建一个元组列表,每个元组有两个元素,第一个是零件id,第二个是零件id的子集