我想创建具有此结构python - For Loop使用Pandas创建具有分支数据的数据集-LMLPHP的数据集

就像创建一个层次结构数据集一样。最终的数据集将包含100 x 2 x 3 x 25 = 15,000行数据。我在Pandas中使用Python
(第1个变量有100个值,第1个变量的每个值中有2个变量。第2个变量的每个值中有3个变量。 3,依此类推)

我曾尝试对4号变量使用ForLoop,但无法弄清楚如何使高级变量交替填充数据集。

variable4= range(0,25)

for i in range (0,25):
    dataset.iloc[i,4] = variable4[i]
    dataset.iloc[i,3] = 'Var3value'


请给我一些有关如何制作这种类型的结构的建议。

P / s:欢迎使用并行计算来加快计算时间!

最佳答案

您可以使用MultiIndex.from_product,然后调用DataFrame构造函数:

a = range(100)
b = list('ab')
c = list('ABC')
d = list(range(100, 125))

mux = pd.MultiIndex.from_product([a,b,c,d], names=list('xyuz'))

df = pd.DataFrame({'col':range(15000)}, index=mux)
print (df)
              col
x  y u z
0  a A 100      0
       101      1
       102      2
       103      3
       104      4
       105      5
       106      6
...
...

关于python - For Loop使用Pandas创建具有分支数据的数据集,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46316113/

10-12 17:03
查看更多