表的每两列之间有一对一的关系,比如Ci <--> Cj
。
我如何存储这样一个表以便快速查找?我将用下面的代码片段清楚地表达自己。
C1 = [1, 2, 3, 4]
C2 = ['a', 'b', 'c', 'd']
C3 = ['one', 'two', 'three', 'four']
# lookup, Ci --> Cj
idx = Ci.index(val)
corresponding_val = Cj[idx]
Dict是个不错的选择。以只有两列的表为例,将表存储为dict,比如
d[C1] = C2
。从O(1)
到C1
需要C2
。但从C2
到C1
需要更长的时间。 最佳答案
如果需要快速查找C1、C2、C3中的任意一个键,则需要三个dict。每个值都是3元组。
all = zip( C1, C2, C3)
d1,d2,d3 = {},{},{}
for v in all:
d1[ v[0]], d2[v[1]], d3[v[2]] = v,v,v
用法:
>>> d3['three']
(3, 'c', 'three')
>>> d1[1]
(1, 'a', 'one')
>>> d2['a']
(1, 'a', 'one')
这是三个索引,只访问一组元组数据,因此它的效率与每次快速查找需要一个散列索引一样。
assert d1[1] is d2['a'] and d1[1] is d3['one']
每列只需要一个dict,因为访问的是整行。但是,有一个假设,即任何列中都没有重复的值。如果可能存在重复项,则每个检索到的值都需要是行元组的列表,而不仅仅是唯一的行元组。如果你需要这个,设置起来并不难:
C2=['odd','even','odd','even']
...
for v in all:
d1.setdefault(v[0],[]).append(v)
d2.setdefault(v[1],[]).append(v)
d3.setdefault(v[2],[]).append(v)
>>> d2
{'even': [(2, 'even', 'two'), (4, 'even', 'four')], 'odd': [(1, 'odd', 'one'), (3, 'odd', 'three')]}
关于python - 如何在Python中存储一对一关系表以进行快速查找?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/37032977/