创作日志:
    
    mysql属实是忘完了,但是现在有一百多万的数据要处理,用excel的话会卡死 = =。现在要做的工作是数据去重,主要是依据两个参数或三个参数去重,突然想到了group by带多个参数,这个应该是基础知识吧,只不过我忘了,于是自己动手测试了一下。
   
    
    
    一、结论
   
    1、group by带有两个或多个参数时,参数值 全部都相同的 数据会归为一类。
    
    2、可以使用 count() 函数统计每一类的数据量,括号中可以使用任意一个参数。
    
    3、可以使用 having 子句筛选出其中重复量大于1的数据。
   
    
    
    二、示例
   
    示例数据
    
     
   
第 1、2 条数据中的(start,end)是相同的,第 5、6、7 条数据(start,end)是相同的。其它两种数据各有1条,所以共有4种数据。
    
     1、接下来使用 group by 对 a,b 进行聚类:
    
   
SELECT start,end FROM test1 GROUP BY start,end
得到的结果如下,共分为4类。可见,group by带有两个参数时,
 
版权声明:本文为web13618542420原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
