我需要找到最快的方法来对数据帧中的每一行进行排序,其中包含数百万行和大约一百列。
所以像这样:
A B C D
3 4 8 1
9 2 7 2
需要成为:
A B C D
8 4 3 1
9 7 2 2
现在,我将对每一行应用排序,并逐行构建一个新的数据帧。我也在为每一排做一些额外的、不那么重要的事情(因此我为什么要用熊猫而不是麻木)。是否可以更快地创建列表列表,然后立即构建新的数据帧?还是我要去赛通?
最佳答案
我想我会在麻木中这样做:
In [11]: a = df.values
In [12]: a.sort(axis=1) # no ascending argument
In [13]: a = a[:, ::-1] # so reverse
In [14]: a
Out[14]:
array([[8, 4, 3, 1],
[9, 7, 2, 2]])
In [15]: pd.DataFrame(a, df.index, df.columns)
Out[15]:
A B C D
0 8 4 3 1
1 9 7 2 2
我原以为这可能行得通,但它对列进行了排序:
In [21]: df.sort(axis=1, ascending=False)
Out[21]:
D C B A
0 1 8 4 3
1 2 7 2 9
啊,熊猫饲养:
In [22]: df.sort(df.columns, axis=1, ascending=False)
值错误:按列排序时,轴必须为0(行)
关于python - 在pandas数据框中对每一行进行排序的最快方法,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/25817930/