跳到主要内容

DISTINCT 去重

前面小节介绍了如何使用 GROUP BY 对查询数据分组,并且 GROUP BY 能起到有效去重作用,本小节介绍如何使用 DISTINCT 去重。

1. 单字段去重

以表 student_course 和 表 student 链接为例:

SELECT \* FROM student_course a INNER JOIN student b ON a.student_id=b.id;

查询结果如下图:

图片描述

上图查询结果中,若只需要学生信息,则需要对结果进行去重:

SELECT DISTINCT student_id 
FROM
student_course a
INNER JOIN
student b
ON a.student_id=b.id;

执行结果如下图 :

图片描述

2. 多字段去重

以表 student_course、course、course、teacher 链接为例:

SELECT \* 
FROM
student_course a
INNER JOIN
course b
ON a.course_id=b.id
INNER JOIN teacher c
ON b.teacher_id=c.id;

查询结果如下图:

图片描述

如上图,若需要得到所有教师的所有课程信息,则需要多个字段对结果去重:

SELECT 
DISTINCT a.course_id,b.course_name,b.teacher_id,c.name
FROM
student_course a
INNER JOIN
course b
ON a.course_id=b.id
INNER JOIN teacher c
ON b.teacher_id=c.id;

去重后查询结果如下图 :

图片描述

Tips:多字段去重意思就是只有所有指定的列信息都相同,才会被认定为重复的信息。

3. 小结

本小节介绍了如何使用 DISTINCT 去重,之前介绍的 GROUP BY 也能起到去重的作用,使用的频率相对较高,它的目的是用来分组进行聚合统计的,例如需要对分组的数据统计:

 SELECT teacher_id,count(\*) FROM course GROUP BY teacher_id;

执行结果如下图:

图片描述

Tips:如上图所示,count(*) 表示使用聚合函数对分组数据统计,这里可以理解为分组重复的总数,例如 teacher_id=1 的总共有 5 条。