显然,快速搜索会在python中生成一百万个memoization装饰器的实现和风格。但是,我对我找不到的口味感兴趣。我希望它能使存储值的缓存具有固定容量。当添加新元素时,如果达到容量,则会删除最旧的值并替换为最新的值。
我担心的是,如果我使用记忆存储大量元素,那么程序将因为内存不足而崩溃。(我不知道这一问题在实践中有多重要。)如果缓存的大小是固定的,那么内存错误就不会是问题了。在程序执行时,我处理的许多问题都是变化的,因此初始缓存的值与以后缓存的值看起来非常不同(以后再发生的可能性也要小得多)。这就是为什么我想用最新的东西代替最旧的东西。
我找到了OrderedDict
类和一个示例,演示了如何对其进行子类化以指定最大大小。我想把它用作缓存,而不是普通的。问题是,我需要memoize decorator接受一个名为dict
的参数,该参数默认为maxlen
。如果它是None
,那么缓存是无限的,并且正常工作。任何其他值都用作缓存的大小。
我希望它的工作方式如下:
@memoize
def some_function(spam, eggs):
# This would use the boundless cache.
pass
和
@memoize(200) # or @memoize(maxlen=200)
def some_function(spam, eggs):
# This would use the bounded cache of size 200.
pass
下面是迄今为止我所拥有的代码,但我不知道如何将参数传递到decorator中,同时使它可以“裸”使用和使用参数。
import collections
import functools
class BoundedOrderedDict(collections.OrderedDict):
def __init__(self, *args, **kwds):
self.maxlen = kwds.pop("maxlen", None)
collections.OrderedDict.__init__(self, *args, **kwds)
self._checklen()
def __setitem__(self, key, value):
collections.OrderedDict.__setitem__(self, key, value)
self._checklen()
def _checklen(self):
if self.maxlen is not None:
while len(self) > self.maxlen:
self.popitem(last=False)
def memoize(function):
cache = BoundedOrderedDict() # I want this to take maxlen as an argument
@functools.wraps(function)
def memo_target(*args):
lookup_value = args
if lookup_value not in cache:
cache[lookup_value] = function(*args)
return cache[lookup_value]
return memo_target
@memoize
def fib(n):
if n < 2: return 1
return fib(n-1) + fib(n-2)
if __name__ == '__main__':
x = fib(50)
print(x)
编辑:根据本的建议,我创建了下面的装饰,我相信这是我想象的工作方式。对于我来说,能够使用这些修饰函数非常重要,这在过去一直是一个问题。但是,对这段代码的快速测试似乎可以正确地工作,即使是在将作业转移到线程池时也是如此。
def memoize(func=None, maxlen=None):
if func:
cache = BoundedOrderedDict(maxlen=maxlen)
@functools.wraps(func)
def memo_target(*args):
lookup_value = args
if lookup_value not in cache:
cache[lookup_value] = func(*args)
return cache[lookup_value]
return memo_target
else:
def memoize_factory(func):
return memoize(func, maxlen=maxlen)
return memoize_factory
最佳答案
@memoize
def some_function(spam, eggs):
# This would use the boundless cache.
pass
这里,
memoize
用作在单个函数参数上调用的函数,并返回函数。memoize
是一个装饰师。@memoize(200) # or @memoize(maxlen=200)
def some_function(spam, eggs):
# This would use the bounded cache of size 200.
pass
这里,
memoize
用作对单个整型参数调用并返回函数的函数,并且返回的函数本身用作修饰器,即对单个函数参数调用并返回函数。memoize
是一家装饰工厂。所以要统一这两个,你必须写一些难看的代码。我可能会这样做,就是让
memoize
看起来像这样:def memoize(func=None, maxlen=None):
if func:
# act as decorator
else:
# act as decorator factory
这样,如果要传递参数,则始终将其作为关键字参数传递,而不设置
func
(应该是位置参数),并且如果只希望所有内容都默认,则它将神奇地直接作为装饰器工作。这意味着@memoize(200)
会给你一个错误;你可以通过做一些类型检查来避免这个错误,看看func
是否可以调用,这在实践中应该很好地工作,但实际上不是很“蟒蛇式”。另一种选择是有两个不同的装饰器,比如
memoize
和bounded_memoize
。无边界的memoize
只需调用设置为bounded_memoize
的maxlen
即可实现简单的实现,因此在实现或维护过程中不会花费任何费用。通常,作为经验法则,我尽量避免破坏一个函数来实现两个仅与切线相关的功能集,特别是当它们具有如此不同的签名时。但是在这种情况下,它确实使decorator的使用是自然的(要求
None
很容易出错,即使从理论上看它更为一致),并且您可能会实现一次并多次使用它,因此在使用点的可读性可能是重要的关注点。