我有一个循环遍历两个列表的过程,一个列表相对较大,而另一个列表相对较小。

例子:

larger_list = list(range(15000))
smaller_list = list(range(2500))

for ll in larger_list:
    for sl in smaller_list:
        pass

我按比例缩小了列表以测试性能,并且我注意到首先循环浏览哪个列表之间存在很大的差异。
import timeit

larger_list = list(range(150))
smaller_list = list(range(25))


def large_then_small():
    for ll in larger_list:
        for sl in smaller_list:
            pass


def small_then_large():
    for sl in smaller_list:
        for ll in larger_list:
            pass


print('Larger -> Smaller: {}'.format(timeit.timeit(large_then_small)))
print('Smaller -> Larger: {}'.format(timeit.timeit(small_then_large)))

>>> Larger -> Smaller: 114.884992572
>>> Smaller -> Larger: 98.7751009799

乍一看,它们看起来是相同的-但是两个功能之间有16秒的差异。

这是为什么?

最佳答案

当您分解其中一个功能时,您将获得:

>>> dis.dis(small_then_large)
  2           0 SETUP_LOOP              31 (to 34)
              3 LOAD_GLOBAL              0 (smaller_list)
              6 GET_ITER
        >>    7 FOR_ITER                23 (to 33)
             10 STORE_FAST               0 (sl)

  3          13 SETUP_LOOP              14 (to 30)
             16 LOAD_GLOBAL              1 (larger_list)
             19 GET_ITER
        >>   20 FOR_ITER                 6 (to 29)
             23 STORE_FAST               1 (ll)

  4          26 JUMP_ABSOLUTE           20
        >>   29 POP_BLOCK
        >>   30 JUMP_ABSOLUTE            7
        >>   33 POP_BLOCK
        >>   34 LOAD_CONST               0 (None)
             37 RETURN_VALUE
>>>

查看地址29和30,看起来这些将在每次内部循环结束时执行。这两个循环看起来基本相同,但是每当内部循环退出时,就会执行这两个指令。在内部使用较小的数字将导致更频繁地执行这些操作,因此增加了时间(与在内部循环中使用较大的数字相比)。

关于python - 为什么嵌套循环的顺序之间存在性能差异?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/35710346/

10-11 22:34
查看更多