我有一个名为main_df的大熊猫数据框,我想将其拆分为十个子数据框,以便于处理。为了分割数据帧,我做了以下工作:

df_split = np.array_split(main_df, 10)


现在,我可以通过执行以下操作来调用每个子集:

df_split[0].head(10)
df_split[1].head(10)


等等...

但是,现在我想创建一个循环,该循环执行涉及每个子数据帧的操作。我在考虑以下方面:

for x in df_split:
    df_split[x] = "some action"


这是通过for循环遍历df_split的每个子数据帧的正确方法吗?任何建议或指导方针将不胜感激。

最佳答案

唯一的问题是实施。遍历df_split时,实际上实际上是直接遍历数据帧,如您所见:

df_split = np.array_split(df, 2)
for x in df_split :
    print(type(x))

<class 'pandas.core.frame.DataFrame'>
<class 'pandas.core.frame.DataFrame'>


因此,基本上不要尝试使用df_splitx编制索引,因为它已经是数据帧。只需做:

for x in df_split:
    x = "some action"

10-02 10:34
查看更多