MySQL关联查询 COUNT数据不准确

  • Post author:
  • Post category:mysql




前提

在业务开发中常遇到关联查询使用

count()

函数做统计的需求,同样在使用该函数时如果处理不当会导致统计出的数据是真实数据N倍的问题,出现重复问题导致统计不准确。出现该问题的原因是关联查询的主表与关联表关联关系不是

一对一

而是

一对多

的关系。



demo数据

以本demo为例,owners表表示车主,vehicle表表示车辆,以下为基础建表语句:

DROP TABLE IF EXISTS `owners`;
CREATE TABLE `owners` (
  `id` int NOT NULL AUTO_INCREMENT,
  `name` varchar(32) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

INSERT INTO `owners` VALUES (1, '张三');
INSERT INTO `owners` VALUES (2, '李四');
INSERT INTO `owners` VALUES (3, '王五');

DROP TABLE IF EXISTS `vehicle`;
CREATE TABLE `vehicle` (
  `id` int NOT NULL AUTO_INCREMENT,
  `brand` varchar(32) DEFAULT NULL,
  `owner_id` int DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

INSERT INTO `vehicle` VALUES (1, '大众', 1);
INSERT INTO `vehicle` VALUES (2, '比亚迪', 2);
INSERT INTO `vehicle` VALUES (3, '奥迪', 1);
INSERT INTO `vehicle` VALUES (4, '大众', 2);
INSERT INTO `vehicle` VALUES (5, '比亚迪', 1);


表关系

车主和车辆的关系为1:N,两表通过own_id关联。

Snipaste_2022-10-10_21-44-09

查询语句:

查询车主的姓名和统计功能。

select o.name,count(o.id)
from owners o
         left join vehicle v on v.owner_id = o.id
group by o.id;

查询结果:

image-20221010220801040

张三有三辆车,李四两辆,王五无车,可见统计方法出现了重复统计。



问题出现的原因

MySQL在进行关联查询时,首先扫描主表,以主表为基础数据通过

on条件匹配关联

表数据。

on v.owner_id = o.id

条件会匹配到张三的车辆表3条数据。

image-20221010221611028



解决方案

使用

count()

函数同时使用

去重


DISTINCT

方法去重。

select o.name, count(distinct o.id)
from owners o
         left join vehicle v on v.owner_id = o.id
group by o.id;

image-20221010222129799



版权声明:本文为weixin_42313773原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。