我想创建具有此结构的数据集
就像创建一个层次结构数据集一样。最终的数据集将包含100 x 2 x 3 x 25 = 15,000行数据。我在Pandas中使用Python
(第1个变量有100个值,第1个变量的每个值中有2个变量。第2个变量的每个值中有3个变量。 3,依此类推)
我曾尝试对4号变量使用ForLoop,但无法弄清楚如何使高级变量交替填充数据集。
variable4= range(0,25)
for i in range (0,25):
dataset.iloc[i,4] = variable4[i]
dataset.iloc[i,3] = 'Var3value'
请给我一些有关如何制作这种类型的结构的建议。
P / s:欢迎使用并行计算来加快计算时间!
最佳答案
您可以使用MultiIndex.from_product
,然后调用DataFrame
构造函数:
a = range(100)
b = list('ab')
c = list('ABC')
d = list(range(100, 125))
mux = pd.MultiIndex.from_product([a,b,c,d], names=list('xyuz'))
df = pd.DataFrame({'col':range(15000)}, index=mux)
print (df)
col
x y u z
0 a A 100 0
101 1
102 2
103 3
104 4
105 5
106 6
...
...
关于python - For Loop使用Pandas创建具有分支数据的数据集,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46316113/