hash表冲突的解决方法一般有两个方向:
  一个是倾向于空间换时间,使用向量加链表可以最大程度的在节省空间的前提下解决冲突。
  另外一个倾向于时间换空间,下面是关于这种思路的一种合适表长度的证明过程:

  这种思路的主要做法是当位置冲突时使用随后的位置保存数据,但是毫无策略的直接使用随后的位置会造成大量的冲突,于是产生了平方位递增的方法,同时使用双方向交替的递增冲突位。

  大家都知道表长度一般选取素数会比较好,那什么样的素数会比较好呢
  素数除了2之外,都可以表示为4k+1和4k+3,就是对素数取模,模余要么是1要么是3,为什么突然说这个呢,因为有一个定理叫双平方定理,是说任意一个素数如果可以表示为两个自然数的平方和,那它一定模4余1。
那和这个定理又有什么关系呢,是这样的,比如说有两个点冲突了,分别在0点的两边(因为单边冲突就找下一个位置了)比如说是a和b,如果这两个冲突,就是说a和b的平方和相对于表长的模余为0,那用上这个定理就是这种情况下表长是模4余1的,那么4k+3的素数作为表长,表的利用率就更高。

  最后来个图片感受下,这个图片来至于学堂在线。

hash表长度优化证明-LMLPHP

04-17 16:37