我有以下表格:
types | id | name
------+----+----------
1 | A
2 | B
4 | C
8 | D
16| E
32| F
和
vendors | id | name | type
--------+----+----------+-----
1 | Alex | 2 //type B only
2 | Bob | 5 //A,C
3 | Cheryl | 32 //F
4 | David | 43 //F,D,A,B
5 | Ed | 15 //A,B,C,D
6 | Felix | 8 //D
7 | Gopal | 4 //C
8 | Herry | 9 //A,D
9 | Iris | 7 //A,B,C
10| Jack | 23 //A,B,C,E
我现在要查询:
select id, name from vendors where type & 16 >0 //should return Jack as he is type E
select id, name from vendors where type & 7 >0 //should return Ed, Iris, Jack
select id, name from vendors where type & 8 >0 //should return David, Ed, Felix, Herry
Postgres中表
types
和vendors
的最佳索引是什么?供应商中我可能有数百万行。此外,与使用第三表的“多对多”关系相比,使用这种按位方法的权衡取舍是什么?哪个更好? 最佳答案
使用可以使用部分索引来解决“&”不是可索引运算符(afaik)的事实:
CREATE INDEX vendors_typeA ON vendors(id) WHERE (type & 2) > 0;
CREATE INDEX vendors_typeB ON vendors(id) WHERE (type & 4) > 0;
当然,每次添加新类型时都需要添加新索引。这是将数据扩展到可以正确索引的关联表的原因之一。您总是可以另外编写触发器来维护位掩码表,但是可以使用多对多表来实际维护数据,因为这样会更加清晰。
如果您对伸缩性和性能的整体评估是说“我可能有数百万行”,那么您还没有做足够的工作来进行这种优化。首先创建结构合理的清晰模型,然后根据有关其性能的真实统计信息对其进行优化。
关于performance - Postgres中的按位运算,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/9226217/