MYSQL表的查询(一般查询+子查询+连接查询)

  • Post author:
  • Post category:mysql



一、mysql查询的五种子句


where(条件查询)、having(筛选)、group by(分组)、order by(排序)、limit(限制结果数







1、where常用运算符:




比较运算符


> ,  < ,=  , != (< >),>=   ,   <=

in(v1,v2..vn)

between v1 and v2    在v1至v2之间(包含v1,v2)




逻辑运算符


not ( ! )  逻辑非

or ( || )    逻辑或

and ( && )  逻辑与


where price>=3000 and price <= 5000 or price >=500 and price <=1000

取500-1000或者3000-5000的值

where price not between 3000 and 5000

不在3000与5000之间的值



模糊查询


like 像

通配符:

%  任意字符

_   单个字符

where goods_name like ‘诺基亚%’

where goods_name like ‘诺基亚N_’





2、group by 分组



一般情况下group需与统计函数(聚合函数)一起使用才有意义

如:select goods_id,goods_name,cat_id,max(shop_price) from goods group by cat_id;

这里取出来的结果中的good_name是错误的!因为shop_price使用了max函数,那么它是取最大的,而语句中使用了group by 分组,那么goods_name并没有使用聚合函数,它只是cat_id下的第一个商品,并不会因为shop_price改变而改变

mysql中的五种统计函数:


(1)MAX:求最大值


select max(goods_price) from goods

这里会取出最大的价格的值,只有值

#查询每个栏目下价格最高的

select cat_id,max(goods_price) from goos group by cat_id;

#查出价格最高的商品编号

select goods_id,max(goods_price) from goods group by goods_id;




(2)MIN:求最小值



(3)SUM:求总数和


#求商品库存总和

select sum(goods_number) from goods;


(4)AVG:求平均值


#求每个栏目的商品平均价格

select cat_id,avg(goods_price) from goods group by cat_id;


(5)COUNT:求总行数


#求每个栏目下商品种类

select cat_id,count(*) from goods group by cat_id;





3、having 与where 的异同点




having与where类似,可以筛选数据,where后的表达式怎么写,having后就怎么写


where针对表中的列发挥作用,

查询

数据



having对查询结果中的列发挥作用,

筛选

数据







#查询本店商品价格比市场价低多少钱,输出低200元以上的商品

select goods_id,good_name,market_price – shop_price as s from goods having s>200 ;

//这里不能用where因为s是查询结果,而where只能对表中的字段名筛选

如果用where的话则是:

select goods_id,goods_name from goods where market_price – shop_price > 200;


#同时使用where与having

select cat_id,goods_name,market_price – shop_price as s from goods where cat_id = 3 having s > 200;






#查询积压货款超过2万元的栏目,以及该栏目积压的货款

select cat_id,sum(shop_price * goods_number) as t from goods group by cat_id having s > 20000






#查询两门及两门以上科目不及格的学生的平均分

思路:

#先计算所有学生的平均分

select name,avg(score) as pj from stu group by name;

#查出所有学生的挂科情况

select name,score<60 from stu;

#这里score<60是判断语句,所以结果为真或假,mysql中真为1假为0

#查出两门及两门以上不及格的学生

select name,sum(score<60) as gk from stu group by name having gk > 1;

#综合结果

select name,sum(score<60) as gk,avg(score) as pj from stu group by name having gk >1;

4、order by


(1) order by price  //默认升序排列

(2)order by price desc //降序排列

(3)order by price asc //升序排列,与默认一样

(4)order by rand() //随机排列,效率不高

#按栏目号升序排列,每个栏目下的商品价格降序排列

select * from goods where cat_id !=2 order by cat_id,price desc;


5、limit



limit [offset,] N

offset 偏移量,可选,不写则相当于limit 0,N

N     取出条目


#取价格第4-6高的商品

select good_id,goods_name,goods_price from goods order by good_price desc limit 3,3;





#查询每个栏目下最贵的商品

思路:

#先对每个栏目下的商品价格排序

select cat_id,goods_id,goods_name,shop_price from goods order by cat_id,shop_price desc;

#上面的查询结果中每个栏目的第一行的商品就是最贵的商品

#把上面的查询结果理解为一个临时表[存在于内存中]【子查询】

#再从临时表中选出每个栏目最贵的商品

select * from (select goods_id,goods_name,cat_id,shop_price from goods order by cat_id,shop_price desc) as t group by cat_id;

#这里使用group by cat_id是因为临时表中每个栏目的第一个商品就是最贵的商品,而group by前面没有使用聚合函数,所以默认就取每个分组的第一行数据,这里以cat_id分组


良好的理解模型:

1、where后面的表达式,把表达式放在每一行中,看是否成立

2、字段(列),理解为变量,可以进行运算(算术运算和逻辑运算)

3、 取出结果可以理解成一张临时表




二、mysql子查询



1、where型子查询




(把内层查询结果当作外层查询的比较条件)


#不用order by 来查询最新的商品

select goods_id,goods_name from goods where goods_id = (select max(goods_id) from goods);

#取出每个栏目下最新的产品(goods_id唯一)

select cat_id,goods_id,goods_name from goods where goods_id in(select max(goods_id) from goods group by cat_id);



2、from型子查询




(把内层的查询结果供外层再次查询)


#用子查询查出挂科两门及以上的同学的平均成绩

思路:


#先查出哪些同学挂科两门以上

select name,count(*) as gk from stu where score < 60 having gk >=2;

#以上查询结果,我们只要名字就可以了,所以再取一次名字

select name from (select name,count(*) as gk from stu having gk >=2) as t;


#找出这些同学了,那么再计算他们的平均分

select name,avg(score) from stu where name in (select name from (select name,count(*) as gk from stu having gk >=2) as t) group by name;



3、exists型子查询




(把外层查询结果拿到内层,看内层的查询是否成立)


#查询哪些栏目下有商品,栏目表category,商品表goods

select cat_id,cat_name from category where exists(select * from goods where goods.cat_id = category.cat_id);


三、连接查询








一、内连接(INNER JOIN)



内连接(INNER JOIN):有两种,显式的和隐式的,返回连接表中符合连接条件和查询条件的数据行。(所谓的链接表就是数据库在做查询形成的中间表)。


例如:下面的语句3和语句4的结果是相同的。


语句1:隐式的内连接,没有INNER JOIN,形成的中间表为两个表的笛卡尔积。



SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME


FROM CUSTOMERS C,ORDERS O


WHERE C.ID=O.CUSTOMER_ID;


语句2:显示的内连接,一般称为内连接,有INNER JOIN,形成的中间表为两个表经过ON条件过滤后的笛卡尔积。



SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME


FROM CUSTOMERS C INNER JOIN ORDERS O ON C.ID=O.CUSTOMER_ID;



二、外联接(OUT JOIN)



外联接可以是左外联接、右外联接和完整外部联接。




在 FROM子句中指定外联接时,可以由下列几组关键字中的一组指定:




1)LEFT  JOIN或LEFT OUTER JOIN






左向外联接的结果集包括  LEFT OUTER子句中指定的左表的所有行,而不仅仅是联接列所匹配的行。如果左表的某行在右表中没有匹配行,则在相关联的结果集行中右表的所有选择列表列均为NULL。




2)RIGHT  JOIN 或 RIGHT  OUTER  JOIN






右向外联接是左向外联接的反向联接。将返回右表的所有行。如果右表的某行在左表中没有匹配行,则将为左表返回NULL。




3)FULL  JOIN 或 FULL OUTER JOIN




完整外部联接返回左表和右表中的所有行。当某行在另一个表中没有匹配行时,则另一个表的选择列表列包含NULL。如果表之间有匹配行,则整个结果集行包含基表的数据值。





#####练习:

例:现有表a

name  hot

a        12

b        10

c        15

表b:

name   hot

d        12

e        10

f         10

g        8

表a左连接表b,查询hot相同的数据

select a.*,b.* from a


left join


b on a.hot = b.hot

查询结果:

name  hot   name  hot

a       12     d       12

b       10     e       10

b       10     f        10

c       15     null    null

从上面可以看出,查询结果表a的列都存在,表b的数据只显示符合条件的项目

再如表b左连接表a,查询hot相同的数据


select a.*,b.* from b


left join


a on a.hot = b.hot

查询结果为:

name  hot   name  hot

d       12     a       12

e        10    b       10

f        10     b      10

g        8     null    null

再如表a右连接表b,查询hot相同的数据

select a.*,b.* from a


right join


b on a.hot = b.hot

查询结果和上面的b

left join

a一样


###练习,查询商品的名称,所属分类,所属品牌


select

goods_id,goods_name,goods.cat_id,goods.brand_id,category.cat_name,brand.brand_name


from

goods


left join

category


on

goods.cat_id = category.cat_id


left join

brand


on

goods.brand_id = brand.brand_id


limit

5;


三、交叉联接 (CROSS JOIN)





交叉联接返回左表中的所有行,左表中的每一行与右表中的所有行组合。交叉联接也称作笛卡尔积。






FROM 子句中的表或视图可通过内联接或完整外部联接按任意顺序指定;但是,用左或右向外联接指定表或视图时,表或视图的顺序很重要




交叉连接(CROSS JOIN):有两种,显式的和隐式的,不带ON子句,返回的是两表的乘积。




例如:下面的语句1和语句2的结果是相同的。


语句1:隐式的交叉连接,没有CROSS JOIN。





SELECT O.ID, O.ORDER_NUMBER, C.ID, C.NAME




FROM ORDERS O , CUSTOMERS C




WHERE O.ID=1;


语句2:显式的交叉连接,使用CROSS JOIN。





SELECT O.ID,O.ORDER_NUMBER,C.ID,




C.NAME




FROM ORDERS O CROSS JOIN CUSTOMERS C




WHERE O.ID=1;




四、联合连接(UNION JOIN)









把两次或多次的查询结果合并起来,要求查询的列数一致,推荐查询的对应的列类型一致,可以查询多张表,多次查询语句时如果列名不一样,则取第一次的列名!

如果不同的语句中取出的行的每个列的值都一样,那么结果将自动会去重复,如果不想去重复则要加all来声明,即union all)

## 现有表a如下

id  num

a    5

b    10

c    15

d    10

表b如下

id  num

b    5

c    10

d    20

e    99


求两个表中id相同的和


select id,sum(num) from (select * from ta union select * from tb) as tmp group by id;

//以上查询结果在本例中的确能正确输出结果,但是,如果把tb中的b的值改为10以查询结果的b的值就是10了,因为ta中的b也是10,所以union后会被过滤掉一个重复的结果,这时就要用union all

select id,sum(num) from (select * from ta union all select * from tb) as tmp group by id;


#取第4、5栏目的商品,按栏目升序排列,每个栏目的商品价格降序排列,用union完成

select goods_id,goods_name,cat_id,shop_price from goods where cat_id=4



union select goods_id,goods_name,cat_id,shop_price from goods where cat_id=5



order by cat_id asc,shop_price desc;

【如果子句中有order by 需要用( ) 包起来,但是推荐在最后使用order by,即对最终合并后的结果来排序】




#取第3、4个栏目,每个栏目价格最高的前3个商品,结果按价格降序排列

(select goods_id,goods_name,cat_id,shop_price from goods where cat_id=3 order by shop_price desc limit 3) union  (select goods_id,goods_name,cat_id,shop_price from goods where cat_id=4 order by shop_price desc limit 3) order by shop_price desc;




四、SQL查询的基本原理:两种情况介绍。




第一、


单表查询:根据WHERE条件过滤表中的记录,形成中间表(这个中间表对用户是不可见的);然后根据SELECT的选择列选择相应的列进行返回最终结果。






第二、


两表连接查询:对两表求积(笛卡尔积)并用ON条件和连接连接类型进行过滤形成中间表;然后根据WHERE条件过滤中间表的记录,并根据SELECT指定的列返回查询结果。






第三、


多表连接查询:先对第一个和第二个表按照两表连接做查询,然后用查询结果和第三个表做连接查询,以此类推,直到所有的表都连接上为止,最终形成一个中间的结果表,然后根据WHERE条件过滤中间表的记录,并根据SELECT指定的列返回查询结果。


理解SQL查询的过程是进行SQL优化的理论依据。



五、ON后面的条件(ON条件)和WHERE条件的区别:



ON条件:是过滤两个链接表笛卡尔积形成中间表的约束条件。


WHERE条件:在有ON条件的SELECT语句中是过滤中间表的约束条件。在没有ON的单表查询中,是限制物理表或者中间查询结果返回记录的约束。在两表或多表连接中是限制连接形成最终中间表的返回结果的约束。


从这里可以看出,将WHERE条件移入ON后面是不恰当的。推荐的做法是:


ON只进行连接操作,WHERE只过滤中间表的记录。



六、总结



连接查询是SQL查询的核心,连接查询的连接类型选择依据实际需求。如果选择不当,非但不能提高查询效率,反而会带来一些逻辑错误或者性能低下。下面总结一下两表连接查询选择方式的依据:




1、 查两表关联列相等的数据用内连接。


2、 Col_L是Col_R的子集时用右外连接。


3、 Col_R是Col_L的子集时用左外连接。


4、 Col_R和Col_L彼此有交集但彼此互不为子集时候用全外。


5、 求差操作的时候用联合查询。




多个表查询的时候,这些不同的连接类型可以写到一块。例如:


SELECT T1.C1,T2.CX,T3.CY


FROM TAB1 T1


INNER JOIN TAB2 T2 ON (T1.C1=T2.C2)


INNER JOIN TAB3 T3 ON (T1.C1=T2.C3)


LEFT OUTER JOIN TAB4 ON(T2.C2=T3.C3);


WHERE T1.X >T3.Y;


上面这个SQL查询是多表连接的一个示范。









版权声明:本文为ApatheCrazyFan原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。