关于uuid与自增列的选择

在db交流群里看到有人提问,说他的userName 登录名是唯一的,可以用其做主键嘛,如果用自增列,那又要多一列。

后面又说,如果要用主键ID,用uuid会不会好一些呢?作为新手的我也对这个问题发生了兴趣,百度检索下得出大致结论:

uuid:可以简单的的理解为全球唯一标识符

一、缺点

  1.无序性:uuid是无序的, 插入数据时,页的位置会发生变化,页分裂,速度慢。一般情况下主键是聚簇索引,会把相邻主键的数据安放在相邻的物理存储上。如果主键不是自增,而是随机的,那么频繁的插入会使 innodb 频繁地移动磁盘块,而影响写入性能。

  2.占空间大:uuid占的空间大,并且别的索引还都要包含主键的值,那么每个索引的空间也都会增大,占的空间大,需要读数据时一般会认为需要的io次数多, 如果需要分库分表,往往是海量数据,这个时候使用UUID不是一个好的选择(占用空间太大)。主键一般情况下追求短整型,确定好你的整型类型(根据需求)。

二、优点

  1.数据离散化便于发布集群

  2.利于水平分割

  3.数据多写,合并复制等分布式操作

自增ID:可以简单理解成一个自增的序列

缺点:

  1.不利于水平分割

  2.插入增加增量,删除不减少增量

  3.数据聚集化不便于发布集群

  4.主键冲突。

  系统大了点,要考虑分布式,甚至数据库双写之类,这样的策略是不够的。举个例子,系统做了双机房,想做一个数据库的异地双向同步。那么当双方还没同步的情况下,可能录入了同样的ID。当然了,只是双机房的话还是可以用 increase by 的方式,把数据库自增步伐修改为奇偶。比如说机房1的主库是基数的ID,机房2的主库是偶数的ID。双向同步创建数据来说就没有冲突了。(双向同步还有好多问题的,并发下的update时序问题等这里不展开讨论)

优点:即uuid缺点的反向

总结:

  总体需要看你索引适应的形式,如果使用 b-tree 索引形式,有序 id 比无需 id 好,如果是 hash 索引,两个差别不大。
  主要原因是索引在磁盘上存储的形式,常用的 b-tree 索引如果 id 是连续的,那么数据存储在相邻的磁盘上,如果查询和写入操作的 id 连续,那么减少随机读写硬盘的几率,提升读写效率。
  所以看你的实际情况,如果你用的是 b-tree 索引,同时记录比较多,那么用有序 id 作为索引效率会高很多。具体情况题主可以自己测试一下,差距明显。
考虑因素要点 :
  1.随机IO与顺序IO
  2.页分裂与所占空间大小
  3.分库分表以及分布式集群
  4.对等拓扑、合并复制、数据多写
 
 
 
 
参考自:
1.http://www.cnblogs.com/ELMND/p/4863577.html
2.https://www.zhihu.com/question/43500172
05-11 22:21
查看更多