本篇讨论可用于处理 WHERE 子句的优化。 这些示例使用 SELECT 语句,但相同的优化适用于 DELETE 和 UPDATE 语句中的 WHERE 子句。
对于有些查询可能想要重写以加快算术运算,但会牺牲可读性。 由于 MySQL 会自动进行类似的优化,因此通常可以避免这项工作,并将查询保留为更易于理解和可维护的形式。 MySQL 执行的一些优化如下:
WHERE 子句优化
移除不必要的括号
((a AND b) AND c OR (((a AND b) AND (c AND d)))) -> (a AND b AND c) OR (a AND b AND c AND d)
连续折叠
(a<b AND b=c) AND a=5 -> b>5 AND b=c AND a=5
移除恒定条件
(b>=5 AND b=5) OR (b=6 AND 5=5) OR (b=7 AND 5=6) -> b=5 OR b=6
在 MySQL 8.0.14 及更高版本中,这发生在准备阶段而不是优化阶段,这有助于简化连接。详情参考 外部连接优化。
索引使用的常量表达式只计算一次
从 MySQL 8.0.16 开始,检查数值类型的列与常量值的比较,并折叠或删除无效或超出范围的值:
# CREATE TABLE t (c TINYINT UNSIGNED NOT NULL); SELECT * FROM t WHERE c ≪ 256; -≫ SELECT * FROM t WHERE 1;
没有 WHERE 条件的单个表上的
COUNT(*)
直接从 MyISAM 和 MEMORY 表的表信息中检索。当仅用于一个表时,对于任何
NOT NULL
表达式执行此操作。早期检测无效常量表达式
MySQL 很快检测到一些 SELECT 语句是不可能的,并且不返回任何行。
如果不使用
GROUP BY
或聚合函数(COUNT()、MIN()
等),则 HAVING 将与 WHERE 合并。对于连接中的每个表,构造一个更简单的 WHERE 以获得对该表的快速 WHERE 评估并尽快跳过行。
在查询中,首先读取所有常量表,然后再读取任何其他表。常数表是下列任一项:
空表或只有一行的表。
与主键或唯一索引上的 WHERE 子句一起使用的一种表,其中所有索引部分都与常量表达式进行比较,并定义为NOT NULL。
以下所有表格都用作常量表格:
SELECT * FROM t WHERE primary_key=1; SELECT * FROM t1,t2 WHERE t1.primary_key=1 AND t2.primary_key=t1.id;
通过尝试所有可能性,可以找到连接表的最佳连接组合。
如果
ORDER BY
和GROUP BY
子句中的所有列都来自同一个表,则联接时优先选择该表。如果有一个 ORDER BY 子句和一个不同的 GROUP BY 子句,或者如果 ORDER BY 或 GROUP BY 包含来自连接队列中第一个表以外的表的列,则会创建一个临时表。
如果使用 SQL_SMALL_RESULT 修饰符,MySQL 将使用内存中的临时表。
查询每个表索引,并使用最佳索引,除非优化器认为使用表扫描更有效。
有一次,根据最佳索引是否跨越表的
30%
来使用扫描,但固定百分比不再决定使用索引还是扫描之间的选择。 优化器现在更加复杂,它的估计基于其他因素,例如表大小、行数和 I/O 块大小。在某些情况下,MySQL甚至不需要检索数据文件就可以从索引中读取行。如果索引中使用的所有列都是数字,则只有索引树用于解析查询。
在输出每一行之前,跳过那些与 HAVING 子句不匹配的行。
一些查询很快的例子
充分使用索引列,索引常量:
SELECT COUNT(*) FROM tbl_name;
SELECT MIN(key_part1),MAX(key_part1) FROM tbl_name;
SELECT MAX(key_part2) FROM tbl_name
WHERE key_part1=constant;
SELECT ... FROM tbl_name
ORDER BY key_part1,key_part2,... LIMIT 10;
SELECT ... FROM tbl_name
ORDER BY key_part1 DESC, key_part2 DESC, ... LIMIT 10;
MySQL仅使用索引树解析以下查询,假设索引列为数字:
SELECT key_part1,key_part2 FROM tbl_name WHERE key_part1=val;
SELECT COUNT(*) FROM tbl_name
WHERE key_part1=val1 AND key_part2=val2;
SELECT MAX(key_part2) FROM tbl_name GROUP BY key_part1;
以下查询使用索引按排序顺序检索行,无需单独的排序过程:
SELECT ... FROM tbl_name
ORDER BY key_part1,key_part2,... ;
SELECT ... FROM tbl_name
ORDER BY key_part1 DESC, key_part2 DESC, ... ;
注意:本文归作者所有,未经作者允许,不得转载