在处理大型数据库时,SQL IN 子句中的 ORWhere 哪个性能更好?

它们的执行方式有什么不同吗?

最佳答案

我假设您想知道以下内容之间的性能差异:

WHERE foo IN ('a', 'b', 'c')
WHERE foo = 'a' OR foo = 'b' OR foo = 'c'

根据 manual for MySQL 如果值是常量 IN 对列表进行排序,然后使用二进制搜索。我会想象 OR 没有特定的顺序对它们进行一一评估。所以 IN 在某些情况下更快。

最好的了解方法是使用您的特定数据在您的数据库上对两者进行分析,以查看哪个更快。

我在一个有 1000000 行的 MySQL 上都试过。当列被索引时,性能上没有明显的差异 - 两者几乎是即时的。当该列未编入索引时,我得到了以下结果:
SELECT COUNT(*) FROM t_inner WHERE val IN (1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000);
1 row fetched in 0.0032 (1.2679 seconds)

SELECT COUNT(*) FROM t_inner WHERE val = 1000 OR val = 2000 OR val = 3000 OR val = 4000 OR val = 5000 OR val = 6000 OR val = 7000 OR val = 8000 OR val = 9000;
1 row fetched in 0.0026 (1.7385 seconds)

所以在这种情况下,使用 OR 的方法慢了大约 30%。添加更多项会使差异更大。结果可能因其他数据库和其他数据而异。

关于sql - SQL WHERE 子句中的 IN 与 OR,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/3074713/

10-16 15:38