我正在学习有关Redis的知识,以及它自从内存数据库以来如何快速发展。在我的Django应用程序中,我有一个包含约1500行的Postgres表。该模型只有两个字段“名称”和“出现”。为了测试从内存中查询对象的速度比从本地数据库(相信存储在磁盘中)要快多少,我创建了两个查询



进行两次查询后,我发现从Redis排序集中获取相同数量的项目所花费的时间比进行Postgres查询所花费的时间长250倍。为什么是这样 ?

脚本

import json
import redis
import datetime

from django.http import HttpResponse
from django.shortcuts import render

from wikipedia.models import Word

redis_server = redis.Redis("localhost")

def get_word_results(request):
    now = datetime.datetime.now()
    words = Word.objects.all().order_by('-occurrence')
    after = datetime.datetime.now()

    diff = (after - now).total_seconds() * 1000
    print(diff)

    rnow = datetime.datetime.now()
    words_redis = redis_server.zrange(name='myzset', start=0, end=-1, withscores=True)
    rafter = datetime.datetime.now()

    diff2 = (rafter - rnow).total_seconds() * 1000
    print(diff2)

结果
0.199
48.048

最佳答案

记住,redis不是通用数据库。在某些查询或用途中,老式的rdbms是可行的方式,在某些情况下,redis优于rdbms。 Redis使您可以快速读取和写入键值存储的数据。即“对于给定的单词,我想检索出现的次数”,而不是“我希望所有单词按出现的顺序排序”。

因此,例如:

def prep_redis():
    for word in Word.objects.all():
        redis_server.set(word.name, word.occurrence)

def test_lookup_postgres(name):
    # start = datetime.datetime.now()
    p = Word.objects.get(name=name)
    # end = datetime.datetime.now()
    # diff = end - start
    # print('postgres took %s ms' % (diff * 1000,))
    return p.occurrence

def test_lookup_redis(name):
    # start = datetime.datetime.now()
    value = redis_server.get(name)
    # end = datetime.datetime.now()
    # diff = end - start
    # print('redis took %s ms' % (diff * 1000,))
    return value

def main():
    from timeit import Timer
    prep_redis()
    r_timer = Timer(lambda: test_lookup_redis('sesame'))
    p_timer = Timer(lambda: test_lookup_postgres('sesame'))
    print('For 1000 runs, redis: %s' % (r_timer.timeit(number=1000),))
    print('For 1000 runs, postgres: %s' % (p_timer.timeit(number=1000),))

在这里,我们期望redis比postgres更快。

相反,对于较大的数据结构,redis的速度非常慢,因为对数据进行序列化和反序列化所需的时间超过了I / O成本:

08-03 13:16
查看更多