我记得从汇编中可以看出,整数除法指令会同时产生商和余数。因此,在python中,内置的divmod()函数是否会比使用%和//运算符在性能方面更好(当然,一个需要商和余数)?

q, r = divmod(n, d)
q, r = (n // d, n % d)

最佳答案

要测量就知道(Macbook Pro 2.8Ghz i7上的所有计时):

>>> import sys, timeit
>>> sys.version_info
sys.version_info(major=2, minor=7, micro=12, releaselevel='final', serial=0)
>>> timeit.timeit('divmod(n, d)', 'n, d = 42, 7')
0.1473848819732666
>>> timeit.timeit('n // d, n % d', 'n, d = 42, 7')
0.10324406623840332
divmod()函数在这里处于劣势,因为您每次都需要查找全局变量。将其绑定(bind)到本地(timeit时间试用中的所有变量都是本地)可以稍微提高性能:
>>> timeit.timeit('dm(n, d)', 'n, d = 42, 7; dm = divmod')
0.13460898399353027

但是运算符仍然会获胜,因为执行divmod()的函数调用时不必保留当前帧:
>>> import dis
>>> dis.dis(compile('divmod(n, d)', '', 'exec'))
  1           0 LOAD_NAME                0 (divmod)
              3 LOAD_NAME                1 (n)
              6 LOAD_NAME                2 (d)
              9 CALL_FUNCTION            2
             12 POP_TOP
             13 LOAD_CONST               0 (None)
             16 RETURN_VALUE
>>> dis.dis(compile('(n // d, n % d)', '', 'exec'))
  1           0 LOAD_NAME                0 (n)
              3 LOAD_NAME                1 (d)
              6 BINARY_FLOOR_DIVIDE
              7 LOAD_NAME                0 (n)
             10 LOAD_NAME                1 (d)
             13 BINARY_MODULO
             14 BUILD_TUPLE              2
             17 POP_TOP
             18 LOAD_CONST               0 (None)
             21 RETURN_VALUE
//%变体使用更多的操作码,但是CALL_FUNCTION字节码是性能上的负担。

在PyPy中,对于小的整数并没有太大的区别。在C整数运算的绝对速度下,操作码所具有的较小的速度优势就消失了:
>>>> import platform, sys, timeit
>>>> platform.python_implementation(), sys.version_info
('PyPy', (major=2, minor=7, micro=10, releaselevel='final', serial=42))
>>>> timeit.timeit('divmod(n, d)', 'n, d = 42, 7', number=10**9)
0.5659301280975342
>>>> timeit.timeit('n // d, n % d', 'n, d = 42, 7', number=10**9)
0.5471200942993164

(我不得不将重复次数提高到10亿次,以表明差异的确有多小,这里PyPy的速度非常快)。

但是,当数字变大时,divmod()会赢得一个国家英里:
>>>> timeit.timeit('divmod(n, d)', 'n, d = 2**74207281 - 1, 26', number=100)
17.620037078857422
>>>> timeit.timeit('n // d, n % d', 'n, d = 2**74207281 - 1, 26', number=100)
34.44323515892029

(与霍布斯的数字相比,我现在不得不将重复次数调低10倍,以在合理的时间内获得结果)。

这是因为PyPy不再可以将这些整数拆箱为C整数;您可以看到在使用sys.maxintsys.maxint + 1之间的时间上的显着差异:
>>>> timeit.timeit('divmod(n, d)', 'import sys; n, d = sys.maxint, 26', number=10**7)
0.008622884750366211
>>>> timeit.timeit('n // d, n % d', 'import sys; n, d = sys.maxint, 26', number=10**7)
0.007693052291870117
>>>> timeit.timeit('divmod(n, d)', 'import sys; n, d = sys.maxint + 1, 26', number=10**7)
0.8396248817443848
>>>> timeit.timeit('n // d, n % d', 'import sys; n, d = sys.maxint + 1, 26', number=10**7)
1.0117690563201904

关于python - divmod()是否比使用%和//运算符快?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30079879/

10-13 07:52