大家好,我是程序员啊粥。
今天给大家分享一个我遇到过的比较少见的面试题,那就是 MySQL 中如何计算一个索引的长度。
说实话,我第一次遇到这个问题的时候想当然的以为索引长度就是我们建表时定义的字段长度,如果是联合索引,那就是多个字段长度相加。
事实证明,在我说出上述回答之后,面试官就让我带着简历跑路了。
于是乎,我仔细查阅了相关资料,发现索引长度这个计算方式还是有点意思的,索性给大家分享一下。
首先,我们要知道 MySQL Innodb 引擎对于索引的长度是有限制的,最大为 767 字节。
你采用不同的字符编码方式,对应的字节数是不一样的,比如我们最常用的 utf8mb4 字符集是 4 字节字符集,则 767 字节 / 4 字节每字符 = 191字符(默认索引最大长度),所以在 varchar(255) 或 char(255) 类型字段上创建索引会失败,报错会提示最大索引长度为 767 字节。
其他的一些编码方式对应关系分别是:latin1 编码的,一个字符占用一个字节,gbk 编码的,一个字符占用两个字节,utf8 编码的,一个字符占用三个字节。
总的来说,索引长度计算规则为:
所有的索引字段,如果没有设置 Not Null,则需要加一个字节(这也是我们为什么建议建表时不要有 Null 字段的原因之一)。
对于定长字段,int 类型占四个字节、date 占三个字节、char(n) 占 N 个字符。
对于变成字段 varchar(n),则是 N 个字符 + 两个字节。
不同的字符集,一个字符占用的字节数不同。latin1编码的,一个字符占用一个字节,gbk编码的,一个字符占用两个字节,utf8编码的,一个字符占用三个字节。
索引长度 char()、varchar() 索引长度的计算公式:
Character Set:utf8mb4=4,utf8=3,gbk=2,latin1=1) * 列长度 + 1(允许 Null) + 2(变长列)
基于以上原则,我们建张表来验证下:
CREATE TABLE `tb_item` (
`id` bigint NOT NULL COMMENT '书籍id,同时也是书籍编号',
`title` varchar(100) NOT NULL COMMENT '书籍名称',
`sell_point` varchar(500) DEFAULT NULL COMMENT '书籍卖点',
`price` bigint NOT NULL COMMENT '书籍价格,单位为:分',
`num` int NOT NULL COMMENT '库存数量',
`barcode` varchar(30) DEFAULT NULL COMMENT '书籍条形码',
`image` varchar(500) DEFAULT NULL COMMENT '书籍图片',
`cid` bigint NOT NULL COMMENT '所属类目,叶子类目',
`status` tinyint NOT NULL DEFAULT '1' COMMENT '书籍状态,1-正常,2-下架,3-删除',
`created` datetime NOT NULL COMMENT '创建时间',
`updated` datetime NOT NULL COMMENT '更新时间',
`upload_id` bigint DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `cid` (`cid`),
KEY `status` (`status`),
KEY `updated` (`updated`),
KEY `tb_item_title_price_num` (`title`,`price`,`num`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='书籍表';
在这张表上我们建立了联合索引 tb_item_title_price_num
,由三个字段组成,分别是变长字段 varchar,定长字段 price 以及 num。
我们先来执行如下这条语句:
explain select * from tb_item where title = '编译原理' and price = 45 and num = 23232
;
我们看到 key 是 tb_item_title_price_num
,同时索引长度 key_len 为 314 ,证明是使用到了联合索引 tb_item_title_price_num
的三个完整字段的。
这个 314 的具体计算方式为:
字符集我们建表时用的为 utf8 编码,所以 title 字段的索引长度是 3 * 100 + 0 + 2 = 302,price 字段的索引长度是 8,num 字段的索引长度是 4。
因此 tb_item_title_price_num 索引总共长度是 302 + 8 + 4 = 314。
为了验证我们的计算方式,接下来我们再执行如下语句,使得索引部分失效。
explain select * from tb_item where title = '编译原理' and num = 23232
这条语句因为我们跳过了 price 字段,所以联合索引中只会有 title 字段生效,剩余部分都会失效,如果我们计算方式没有问题的话,那么此时执行计划中的 key_len 应该为 302。
果然,我们看到 key_len 已经变成了 302,这意味着索引部分失效了,只有 title 字段索引起了作用,同时 Extra 为 Using index condition
,说明使用了索引,但是需要回表查询数据。
具体 explain 执行计划中其他字段的具体含义,参考这篇文章。
好了,我们今天的内容就到这里了。
简单总结一下,在 MySQL 中,索引长度不仅取决于我们建表时设置的字段长度,还和具体的字符集编码以及字段是否允许为 Null 等多个条件相关,字段长度只能作为索引长度的预估项,而不是准确值。