我有以下表格:

types | id | name
------+----+----------
         1 | A
         2 | B
         4 | C
         8 | D
         16| E
         32| F


vendors | id | name     | type
--------+----+----------+-----
           1 | Alex     | 2     //type B only
           2 | Bob      | 5     //A,C
           3 | Cheryl   | 32    //F
           4 | David    | 43    //F,D,A,B
           5 | Ed       | 15    //A,B,C,D
           6 | Felix    | 8     //D
           7 | Gopal    | 4     //C
           8 | Herry    | 9     //A,D
           9 | Iris     | 7     //A,B,C
           10| Jack     | 23    //A,B,C,E

我现在要查询:
select id, name from vendors where type & 16 >0 //should return Jack as he is type E
select id, name from vendors where type & 7 >0 //should return Ed, Iris, Jack
select id, name from vendors where type & 8 >0 //should return David, Ed, Felix, Herry

Postgres中表typesvendors的最佳索引是什么?供应商中我可能有数百万行。此外,与使用第三表的“多对多”关系相比,使用这种按位方法的权衡取舍是什么?哪个更好?

最佳答案

使用可以使用部分索引来解决“&”不是可索引运算符(afaik)的事实:

CREATE INDEX vendors_typeA ON vendors(id) WHERE (type & 2) > 0;
CREATE INDEX vendors_typeB ON vendors(id) WHERE (type & 4) > 0;

当然,每次添加新类型时都需要添加新索引。这是将数据扩展到可以正确索引的关联表的原因之一。您总是可以另外编写触发器来维护位掩码表,但是可以使用多对多表来实际维护数据,因为这样会更加清晰。

如果您对伸缩性和性能的整体评估是说“我可能有数百万行”,那么您还没有做足够的工作来进行这种优化。首先创建结构合理的清晰模型,然后根据有关其性能的真实统计信息对其进行优化。

关于performance - Postgres中的按位运算,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/9226217/

10-11 03:42