MYSQLGROUPBY用法详解

2022-06-15 来源：知库网

背景介绍

最近在设计数据库的时候因为开始考虑不周，所以产生了大量的重复数据。现在需要把这些重复的数据删除掉，使用到的语句就是Group By来完成。为了进一步了解这条语句的作用，我打算先从简单入手。

建一个测试表

代码如下:create table test_group(id int auto_increment primary key, name varchar(32), class varchar(32), score int);

查看表结构

desc test_group

插入数据

测试开始

我想知道当前每一个班级里面最高分数的同学是谁。

代码如下:select name, class , max(score) from test_group group by class;

好现在可以插入几条重复的数据。

代码如下:insert into test_group(name, class, score)values('repeat','B',89);

现在要过滤掉重复的数据，保留最新的那条记录。一般我们假设最新的记录是最后插入的那条，所以它的ID应该是最大的那条。

代码如下:select name, class, max(id) from test_group group by name;

可以发现，我们关注那个项的重复性就把它放到gourp by后面。这样我们就可以过滤掉那些与这个项重复的记录啦。现在我们得到了我们需要的数据，我们下一步就是把那些重复的数据删除。为了区分我们过滤出来的数据记录与原有的记录，我们可以给id取一个别名。

代码如下:select name, class, max(id) as max_id from test_group group by name;

下一步就是把这些关心的数据保留下来，我先把这些数据的id提取出来。因为这个是唯一确定一条记录的。

代码如下:select max_id from (select name, class, max(id) as max_id from test_group group by name)b;

下面就是删除操作了。思路就是删除那些数据ID不在我们查询结果里面的记录。为了方便操作后对数据的对比，我先进行一次全部查询。

代码如下:select * from test_group;

执行删除操作。

代码如下:delete from test_group where id not in (select max_id from (select name, class, max(id) as max_id from test_group group by name)b);

最后查看结果。

总结

MySQL操作还是很灵活的，之前一直喜欢用ORM现在感觉直接使用MYSQL省去了很多事。如果你有更好更高效的方式就请你分享分享吧~~

显示全文