假设我有一个指数方阵,例如:

idxs = np.array([[1, 1],
                 [0, 1]])


以及彼此大小相同的正方形矩阵数组(不一定与idxs大小相同):

mats = array([[[ 0. ,  0. ],
               [ 0. ,  0.5]],

              [[ 1. ,  0.3],
               [ 1. ,  1. ]]])


我想用idxs中的相应矩阵替换mats中的每个索引,以获得:

array([[ 1. ,  0.3,  1. ,  0.3],
       [ 1. ,  1. ,  1. ,  1. ],
       [ 0. ,  0. ,  1. ,  0.3],
       [ 0. ,  0.5,  1. ,  1. ]])


mats[idxs]给了我这个的嵌套版本:

array([[[[ 1. ,  0.3],
         [ 1. ,  1. ]],

        [[ 1. ,  0.3],
         [ 1. ,  1. ]]],


       [[[ 0. ,  0. ],
         [ 0. ,  0.5]],

        [[ 1. ,  0.3],
         [ 1. ,  1. ]]]])


所以我尝试使用reshape,但是“白费力气! mats[idxs].reshape(4,4)返回:

array([[ 1. ,  0.3,  1. ,  1. ],
       [ 1. ,  0.3,  1. ,  1. ],
       [ 0. ,  0. ,  0. ,  0.5],
       [ 1. ,  0.3,  1. ,  1. ]])


如果有帮助,我发现skimage.util.view_as_blocks是我所需要的确切逆数(它可以将所需的结果转换为嵌套的mats[idxs]形式)。

有(希望非常)快速的方法吗?对于该应用程序,我的mats仍然只有几个小的矩阵,但是我的idxs将是一个高达2 ^ 15的方阵,在这种情况下,我将替换一百万个索引以创建一个2 ^ 16阶的新矩阵。

非常感谢你的帮助!

最佳答案

我们正在使用这些索引来索引输入数组的第一轴。要获得2D输出,我们只需要排列轴并在之后进行重塑。因此,一种方法是使用np.transpose / np.swapaxesnp.reshape,就像这样-

mats[idxs].swapaxes(1,2).reshape(-1,mats.shape[-1]*idxs.shape[-1])


样品运行-

In [83]: mats
Out[83]:
array([[[1, 1],
        [7, 1]],

       [[6, 6],
        [5, 8]],

       [[7, 1],
        [6, 0]],

       [[2, 7],
        [0, 4]]])

In [84]: idxs
Out[84]:
array([[2, 3],
       [0, 3],
       [1, 2]])

In [85]: mats[idxs].swapaxes(1,2).reshape(-1,mats.shape[-1]*idxs.shape[-1])
Out[85]:
array([[7, 1, 2, 7],
       [6, 0, 0, 4],
       [1, 1, 2, 7],
       [7, 1, 0, 4],
       [6, 6, 7, 1],
       [5, 8, 6, 0]])




np.take可提高性能以重复索引

对于重复索引,为了提高性能,我们最好通过沿np.take进行索引来使用axis=0。让我们列出这两种方法,并使用具有许多重复索引的idxs对其进行计时。

功能定义-

def simply_indexing_based(mats, idxs):
    ncols = mats.shape[-1]*idxs.shape[-1]
    return mats[idxs].swapaxes(1,2).reshape(-1,ncols)

def take_based(mats, idxs):np.take(mats,idxs,axis=0)
    ncols = mats.shape[-1]*idxs.shape[-1]
    return np.take(mats,idxs,axis=0).swapaxes(1,2).reshape(-1,ncols)


运行时测试-

In [156]: mats = np.random.randint(0,9,(10,2,2))

In [157]: idxs = np.random.randint(0,10,(1000,1000))
                 # This ensures many repeated indices

In [158]: out1 = simply_indexing_based(mats, idxs)

In [159]: out2 = take_based(mats, idxs)

In [160]: np.allclose(out1, out2)
Out[160]: True

In [161]: %timeit simply_indexing_based(mats, idxs)
10 loops, best of 3: 41.2 ms per loop

In [162]: %timeit take_based(mats, idxs)
10 loops, best of 3: 27.3 ms per loop


因此,我们看到了1.5x+的整体改进。

只是为了了解np.take的改进,让我们花些时间单独编制索引部分-

In [168]: %timeit mats[idxs]
10 loops, best of 3: 22.8 ms per loop

In [169]: %timeit np.take(mats,idxs,axis=0)
100 loops, best of 3: 8.88 ms per loop


对于这些数据大小,其2.5x+。不错!

09-07 20:13