数据库 distinct 和 group by 的区别

这两者本质上应该没有可比性,distinct 取出唯一列,group by 是分组,但有时候在优化的时候,在没有聚合函数的时候,他们查出来的结果也一样。 
举例来说可能方便一点。 
A表 
id num 
a 1 
b 2 
c 3 
a 4 
c 7 
d 3 
e 5 

如果只选出id列,用distinct和group by 一样的。 
select distinct(id) from A; 
id 




e; 
select id from A group by id; 
id 




e; 
不同之处可能在于group by有排序功能。 
但是如果需要加上另一列num,结果不同。 
group by 是分组语句,如果用 
select id,num from A group by id,num; 
这样的结果在本例中与不加group by是一样的,因为num各个不同。 
但是如果 
select id,num from A group by id; 
注意该语句是错误语句,因为num没有使用聚组函数,例如:sum(求和),avg(求平均数) 
select id,sum(num) from A group by id; 
id sum(num) 
a 5 
b 2 
c 10 
d 3 
e 5 

用distinct不显示重复的行。 
在本例中 
select distinct id,num from A;的结果也和不加distinct一致。 
因为id,num没有重复的行,而不是只看id。 

group by 功能更强大一些,另外推荐使用group by。 
因为distinct会导致全表扫描,而group by如果索引建的 

恰当的话,会有性能上的提高。

那DISTINCT 和GROUP BY哪个效率更高?

       DISTINCT操作只需要找出所有不同的值就可以了。而GROUP BY操作还要为其他聚集函数进行准备工作。从这一点上将,GROUP BY操作做的工作应该比DISTINCT所做的工作要多一些。

       但实际上,GROUP BY 效率会更高点,为什么呢?对于DISTINCT操作,它会读取了所有记录,而GROUP BY需要读取的记录数量与分组的组数量一样多,也就是说比实际存在的记录数目要少很多。

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。