考虑以下代码
one, two = sales.random_split(0.5, seed=0)
set_1, set_2 = one.random_split(0.5, seed=0)
set_3, set_4 = two.random_split(0.5, seed=0)
我在这段代码中尝试将Sales
Sframe(类似于Pandas DataFrame)中的数据随机分成大约4个相等的部分。什么是Pythonic/有效的方式来实现这一目标?
最佳答案
np.random.seed(0)
np.random.shuffle(arr) # in-place
sets = np.array_split(arr, 4)
关于python - 在Python中高效分割数据,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34337582/