我正在学习有关Redis的知识,以及它自从内存数据库以来如何快速发展。在我的Django应用程序中,我有一个包含约1500行的Postgres表。该模型只有两个字段“名称”和“出现”。为了测试从内存中查询对象的速度比从本地数据库(相信存储在磁盘中)要快多少,我创建了两个查询
进行两次查询后,我发现从Redis排序集中获取相同数量的项目所花费的时间比进行Postgres查询所花费的时间长250倍。为什么是这样 ?
脚本
import json
import redis
import datetime
from django.http import HttpResponse
from django.shortcuts import render
from wikipedia.models import Word
redis_server = redis.Redis("localhost")
def get_word_results(request):
now = datetime.datetime.now()
words = Word.objects.all().order_by('-occurrence')
after = datetime.datetime.now()
diff = (after - now).total_seconds() * 1000
print(diff)
rnow = datetime.datetime.now()
words_redis = redis_server.zrange(name='myzset', start=0, end=-1, withscores=True)
rafter = datetime.datetime.now()
diff2 = (rafter - rnow).total_seconds() * 1000
print(diff2)
结果
0.199
48.048
最佳答案
记住,redis不是通用数据库。在某些查询或用途中,老式的rdbms是可行的方式,在某些情况下,redis优于rdbms。 Redis使您可以快速读取和写入键值存储的数据。即“对于给定的单词,我想检索出现的次数”,而不是“我希望所有单词按出现的顺序排序”。
因此,例如:
def prep_redis():
for word in Word.objects.all():
redis_server.set(word.name, word.occurrence)
def test_lookup_postgres(name):
# start = datetime.datetime.now()
p = Word.objects.get(name=name)
# end = datetime.datetime.now()
# diff = end - start
# print('postgres took %s ms' % (diff * 1000,))
return p.occurrence
def test_lookup_redis(name):
# start = datetime.datetime.now()
value = redis_server.get(name)
# end = datetime.datetime.now()
# diff = end - start
# print('redis took %s ms' % (diff * 1000,))
return value
def main():
from timeit import Timer
prep_redis()
r_timer = Timer(lambda: test_lookup_redis('sesame'))
p_timer = Timer(lambda: test_lookup_postgres('sesame'))
print('For 1000 runs, redis: %s' % (r_timer.timeit(number=1000),))
print('For 1000 runs, postgres: %s' % (p_timer.timeit(number=1000),))
在这里,我们期望redis比postgres更快。
相反,对于较大的数据结构,redis的速度非常慢,因为对数据进行序列化和反序列化所需的时间超过了I / O成本: