MySQL第一讲：MySQL索引规范 – 小飞侠

MySQL第一讲：MySQL索引规范

Post author:xfxia
Post published:2023年8月30日
Post category:mysql

索引（Index）是帮助MySQL高效获取数据的数据结构。数据库系统维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法。这种数据结构，就是索引。

文章目录

1、类型（三种）

主键索引名为 pk_字段名；唯一索引名为 uk_字段名；普通索引名则为 idx_字段名。

说明：

pk_ 即 primary key； uk_ 即 unique key

2、规范(10余条)

序号	规范	说明	例子
1	【强制】业务上具有唯一特性的字段，即使是多个字段的组合，也必须建成唯一索引。	不要以为唯一索引影响了 insert 速度，这个速度损耗可以忽略，但提高查找速度是明显的；另外，即使在应用层做了非常完善的校验控制，只要没有唯一索引，根据墨菲定律，必然有脏数据产生	节能环保打标表 UNIQUE INDEX `uk_config_brand_spec_auth` ( `config_id` , `brand_id` , `specification` (255), `auth_code` (255)) USING BTREE, 区划限价设置表(牧谦) CREATE UNIQUE INDEX uni_district ON db_item.zcy_district_category_price (category_id,config_id,district_id);
2	【强制】超过三个表禁止 join。	需要 join 的字段，数据类型必须绝对一致；多表关联查询时，保证被关联的字段需要有索引。即使双表 join 也要注意表索引、 SQL 性能。	商品库不存在join
3	【强制】在 varchar 字段上建立索引时，必须指定索引长度，没必要对全字段建立索引，根据实际文本区分度决定索引长度即可	索引的长度与区分度是一对矛盾体，一般对字符串类型数据，长度为 20 的索引，区分度会高达 90%以上，可以使用 count(distinct left(列名, 索引长度))/count(*)的区分度来确定	属性值表 create index idx_name on db_item.parana_property_value (name(100))
4	【强制】页面搜索严禁左模糊或者全模糊，如果需要请走搜索引擎来解决。	索引文件具有 B-Tree 的最左前缀匹配特性，如果左边的值未确定，那么无法使用此索引	属性值表 INDEX `idx_name` ( `name` (20)) USING BTREE SQL：AND `name` LIKE CONCAT(#{name},‘%’)
5	【推荐】如果有 order by的场景，请注意利用索引的有序性。 order by 最后的字段是组合索引的一部分，并且放在索引组合顺序的最后，避免出现 file_sort(文件排序)的情况，影响查询性能。	正例： where a=? and b=? order by c; 索引： a_b_c 反例：索引中有范围查找，那么索引有序性无法利用，如： WHERE a>10 ORDER BY b; 索引a_b 无法排序。	spu库(奕铭)：IDX_category_status_createdAt(category_id,status,created_at) sql：WHERE category_id = 4619 and `status` = 3 order by created_at DESC LIMIT 0, 500
6	【推荐】利用覆盖索引来进行查询操作，避免回表。覆盖索引：	如果一本书需要知道第 11 章是什么标题，会翻开第 11 章对应的那一页吗？目录浏览一下就好，这个目录就是起到覆盖索引的作用。	能够建立索引的种类分为主键索引、唯一索引、普通索引三种，而覆盖索引只是一种查询的一种效果，用 explain 的结果， extra 列会出现： using index。
7	【推荐】利用延迟关联或者子查询优化超多分页场景。	MySQL 并不是跳过 offset 行，而是取 offset+N 行，然后返回放弃前 offset 行，返回N 行，那当 offset 特别大的时候，效率就非常的低下，要么控制返回的总页数，要么对超过特定阈值的页数进行 SQL 改写	先快速定位需要获取的 id 段，然后再关联：SELECT a.* FROM 表 1 a, (select id from 表 1 where 条件 LIMIT 100000,20 ) b where a.id=b.id
8	【推荐】 SQL 性能优化的目标：至少要达到 range 级别，要求是 ref 级别，如果可以是consts最好	1） consts 单表中最多只有一个匹配行（主键或者唯一索引），在优化阶段即可读取到数据。2） ref 指的是使用普通的索引（normal index）。3） range 对索引进行范围检索	反例：explain 表的结果， type=index，索引物理文件全扫描，速度非常慢，这个 index 级别比较 range 还低，与全表扫描是小巫见大巫
9	【推荐】建组合索引的时候，区分度最高的在最左边。	存在非等号和等号混合时，在建索引时，请把等号条件的列前置。如： where c>? and d=? 那么即使 c 的区分度更高，也必须把 d 放在索引的最前列，即索引 idx_d_c。	如果 where a=? and b=? ，如果 a 列的几乎接近于唯一值，那么只需要单建 idx_a索引即可。5.7提供自动顺序优化**
10	【推荐】防止因字段类型不同造成的隐式转换，导致索引失效	例子：
11	【参考】创建索引时避免有如下极端误解	1）宁滥勿缺。认为一个查询就需要建一个索引。 2）宁缺勿滥。认为索引会消耗空间、严重拖慢更新和新增速度。 3）抵制惟一索引。认为业务的惟一性一律需要在应用层通过“先查后插”方式解决。	唯一索引踩坑：

CheckList

Action1 、三个字段联合索引时，如果中间的字段使用了范围查询或者模糊查询，最后一个字段还会用到索引么？

用得到

Action2、在order by时，索引是如何使用的？

使用了 filesort 模式

Action3、新建一张表，如何界定其索引的数量，有没有选择或者公式

根据业务场景选择，不要遗漏索引，索引也不是越多越好

Action4、字符串如何加索引，能不能再详细介绍下字符串前缀索引

使用某个字段中字符串的前几个字符建立索引。

前缀索引优化为什么需要优化？索引文件是存储在磁盘中的，而磁盘中最小分配单元是页，通常一个页的默认大小为 16KB，减小索引字段大小，可以增加一个页中存储的索引项，有效提高索引的查询速度

Action5、什么是覆盖索引？

select ID from T where k between 3 and 5
，这时只需要查ID的值，而ID的值已经在k索引树上了，因此可以直接提供查询结果，不需要回表。也就是说，在这个查询里面，

索引k已经“覆盖了”我们的查询需求，我们称为覆盖索引

。

具体见这篇文章：

MySQL第二讲：MySQL索引原理

版权声明：本文为qq_28959087原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

原文链接：https://blog.csdn.net/qq_28959087/article/details/103555362

Tags: mysql