为啥你的SQL慢?为啥你建的索引常失效?

  • Post author:
  • Post category:其他


怎么知道该sql是全表扫描呢?通过explain命令可以清楚MySQL是如何处理sql语句的。

在这里插入图片描述

  • id : 查询序列号为1
  • select_type : 查询类型是简单查询,简单的select语句没有union和子查询
  • table :表是 itdragon_order_list。
  • partitions :没有分区
  • type : 连接类型,all表示采用全表扫描的方式。
  • possible_keys : 可能用到索引为null。
  • key : 实际用到索引是null。
  • key_len : 索引长度当然也是null。
  • ref : 没有哪个列或者参数和key一起被使用。
  • rows :SQL查询了3条记录
  • Extra : 使用了where查询。


优化:为transaction_id创建索引


在这里插入图片描述

唯一索引打印的type值是const。表示通过索引一次就可以找到。即找到值就结束扫描返回查询结果。

在这里插入图片描述

普通索引打印的type值是ref。表示非唯一性索引扫描。找到值还要继续扫描,直到将索引文件扫描完为止。


优化:覆盖索引


在这里插入图片描述

将select * from 改为了 select transaction_id from 后Extra 显示 Using index,表示该查询使用了覆盖索引

若提示的是Using filesort(使用内部排序)和Using temporary(使用临时表)则表明该sql需要立即优化了


优化:为order_level,input_date 创建复合索引


在这里插入图片描述

采用全表扫描就不合理,还使用了文件排序Using filesort,更加拖慢了性能。

在这里插入图片描述

和没创建索引一样?都是全表扫描,都用到了文件排序。是索引失效?还是索引创建失败?

在这里插入图片描述

将select * from 换成了 select order_level,input_date from 后。type从ALL升级为index,表示(full index scan)全索引文件扫描,Extra也显示使用了覆盖索引。

返回的内容只有order_level和input_date 两个字段,难道把每个字段都建一个复合索引?

使用force index 强制指定索引。在原来的sql语句上修改 force index(idx_order_levelDate) 即可

在这里插入图片描述



索引简介

索引为什么是一种数据结构,它又是怎么提高查询的速度?我们拿最常用的二叉树来分析索引的工作原理。看下面的图片:

在这里插入图片描述


索引分类


索引一般指的是BTree(多路搜索树)结构组织的索引。其中还有聚合索引,次要索引,复合索引,前缀索引,唯一索引,统称索引,当然除了B+树外,还有哈希索引(hash index)等。

  • 单值索引:一个索引只包含单个列,一个表可以有多个单列索引
  • 唯一索引:索引列的值必须唯一,但允许有空值
  • 复合索引:一个索引包含多个列,实际开发中推荐使用

实际开发中推荐使用复合索引,并且单表创建的索引个数建议不要超过五个

哪些情况需要建索引:

  • 主键,唯一索引
  • 经常用作查询条件的字段需要创建索引
  • 经常需要排序、分组和统计的字段需要建立索引
  • 查询中与其他表关联的字段,外键关系建立索引

哪些情况不要建索引:

  • 表的记录太少,百万级以下的数据不需要创建索引
  • 经常增删改的表不需要创建索引
  • 数据重复且分布平均的字段不需要创建索引,如 true,false 之类。
  • 频发更新的字段不适合创建索引
  • where条件里用不到的字段不需要创建索引


性能分析

explain 分析sql语句

+----+-------------+-------+------------+------+---------------+-----+---------+------+------+----------+-------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref  | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+-----+---------+------+------+----------+-------+

id

select 查询的序列号,包含一组可以重复的数字,表示查询中执行sql语句的顺序。一般有三种情况:

  • id全部相同,sql的执行顺序是由上至下;
  • id全部不同,sql的执行顺序是根据id大的优先执行;
  • id既存在相同,又存在不同的。先根据id大的优先执行,再根据相同id从上至下的执行。

select_type

select 查询的类型,主要是用于区别普通查询,联合查询,嵌套的复杂查询

  • simple:简单的select 查询,查询中不包含子查询或者union
  • primary:查询中若包含任何复杂的子查询,最外层查询则被标记为primary
  • subquery:在select或where 列表中包含了子查询
  • derived:在from列表中包含的子查询被标记为derived(衍生)MySQL会递归执行这些子查询,把结果放在临时表里。
  • union:若第二个select出现在union之后,则被标记为union,若union包含在from子句的子查询中,外层select将被标记为:derived
  • union result:从union表获取结果的select

partitions

表所使用的分区,如果要统计十年公司订单的金额,可以把数据分为十个区,每一年代表一个区。这样可以大大的提高查询效率。

type

这是一个非常重要的参数,连接类型,常见的有:all , index , range , ref , eq_ref , const , system , null 八个级别。

性能从最优到最差的排序:system > const > eq_ref > ref >

range

> index > all

  • all:(full table scan)全表扫描无疑是最差,若是百万千万级数据量,全表扫描会非常慢。
  • index:(full index scan)全索引文件扫描比all好很多,毕竟从索引树中找数据,比从全表中找数据要快。
  • range:只检索给定范围的行,使用索引来匹配行。范围缩小了,当然比全表扫描和全索引文件扫描要快。sql语句中一般会有between,in,>,< 等查询。

    若保证查询至少达到range级别或者最好能达到ref
  • ref:非唯一性索引扫描,本质上也是一种索引访问,返回所有匹配某个单独值的行。比如查询公司所有属于研发团队的同事,匹配的结果是多个并非唯一值。
  • eq_ref:唯一性索引扫描,对于每个索引键,表中有一条记录与之匹配。比如查询公司的CEO,匹配的结果只可能是一条记录,
  • const:表示通过索引一次就可以找到,const用于比较primary key 或者unique索引。因为只匹配一行数据,所以很快,若将主键至于where列表中,MySQL就能将该查询转换为一个常量。
  • system:表只有一条记录(等于系统表),这是const类型的特列,平时不会出现,了解即可

possible_keys:显示查询语句可能用到的索引(一个或多个或为null),不一定被查询实际使用。仅供参考使用。

key:显示查询语句实际使用的索引。若为null,则表示没有使用索引。

key_len:显示索引中使用的字节数,可通过key_len计算查询中使用的索引长度。在不损失精确性的情况下索引长度越短越好。

key_len 显示的值为索引字段的最可能长度,并非实际使用长度,即key_len是根据表定义计算而得,并不是通过表内检索出的。

ref:显示索引的哪一列或常量被用于查找索引列上的值。

rows:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数,值越大越不好

extra

  • Using filesort:说明MySQL会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序” 。出现这个就要立刻优化sql。
  • Using temporary:使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序 order by 和 分组查询 group by。出现这个更要立刻优化sql。
  • Using index:表示相应的select 操作中使用了覆盖索引(Covering index),避免访问了表的数据行,效果不错!如果同时出现Using where,表明索引被用来执行索引键值的查找。如果没有同时出现Using where,表示索引用来读取数据而非执行查找动作。
  • 覆盖索引(Covering Index) :也叫索引覆盖,就是select 的数据列只用从索引中就能够取得,不必读取数据行,MySQL可以利用索引返回select 列表中的字段,而不必根据索引再次读取数据文件。
  • Using index condition:在5.6版本后加入的新特性,优化器会在索引存在的情况下,通过符合RANGE范围的条数 和 总数的比例来选择是使用索引还是进行全表遍历。
  • Using where:表明使用了where 过滤
  • Using join buffer:表明使用了连接缓存
  • impossible where:where 语句的值总是false,不可用,不能用来获取任何元素
  • distinct:优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。

filtered

一个百分比的值,和rows 列的值一起使用,可以估计出查询执行计划(QEP)中的前一个表的结果集,从而确定join操作的循环次数。小表驱动大表,减轻连接的次数。

总结:通过explain的参数介绍,我们可以得知:

  1. 表的读取顺序(id)
  2. 数据读取操作的操作类型(type)
  3. 哪些索引被实际使用(key)
  4. 表之间的引用(ref)
  5. 每张表有多少行被优化器查询(rows)



版权声明:本文为jiaojiao521765146514原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。