《高性能mysql第三版》提到mysql会将in子查询改写成exists查询(书中基于的mysql版本是5.1.50和5.5)
但是在5.6之后,已经优化成使用半连接查询
SELECT class_num, class_name FROM class WHERE class_num IN (SELECT class_num FROM roster);
在这里,优化器可以识别出该 IN
子句要求子查询仅返回roster
表中每个类编号的一个实例 。在这种情况下,查询可以使用半联接;也就是说,该操作仅返回的每一行的一个实例,该实例 class
与的行匹配 roster
。
外部查询规范中允许使用外部联接和内部联接语法,并且表引用可以是基表,派生表或视图引用。
结论:
1、mysql5.5以前会将 in 子查询改写成 exists 查询,如果外部表数据量大的情况下性能会非常糟糕。
2、mysql5.7(5.6没有测过,感兴趣的同学可以测测)对 in 子查询进行了优化,会将sql改写成 join 连接,这样优化器就可以始终优先访问数据量小的表格,减少IO,性能和直接写连接查询几乎是一样的(这点和网上书上说的是有出入的)。
3、exists查询会被分解成一个外部查询和相关子查询(DEPENDENT SUBQUERY),这样子查询会依赖于外部查询的结果,所以始终会对外部表进行全表扫描,外部表数据量大的时候要尤其注意。
参考文章
http://www.ishenping.com/ArtInfo/3900373.html mysql数据库中 IN 和 EXISTS 的误区
https://dev.mysql.com/doc/refman/5.5/en/subquery-optimization.html mysql官方文档解释
https://dev.mysql.com/doc/refman/5.6/en/subquery-optimization.html mysql官方文档解释
注意:
1:可以通过show warnings查看
2:阅读参考文章