我有一个名为main_df的大熊猫数据框,我想将其拆分为十个子数据框,以便于处理。为了分割数据帧,我做了以下工作:
df_split = np.array_split(main_df, 10)
现在,我可以通过执行以下操作来调用每个子集:
df_split[0].head(10)
df_split[1].head(10)
等等...
但是,现在我想创建一个循环,该循环执行涉及每个子数据帧的操作。我在考虑以下方面:
for x in df_split:
df_split[x] = "some action"
这是通过for循环遍历df_split的每个子数据帧的正确方法吗?任何建议或指导方针将不胜感激。
最佳答案
唯一的问题是实施。遍历df_split
时,实际上实际上是直接遍历数据帧,如您所见:
df_split = np.array_split(df, 2)
for x in df_split :
print(type(x))
<class 'pandas.core.frame.DataFrame'>
<class 'pandas.core.frame.DataFrame'>
因此,基本上不要尝试使用
df_split
为x
编制索引,因为它已经是数据帧。只需做:for x in df_split:
x = "some action"