MySQL数据库中删除重复记录的方法总结[推荐]

所属分类: 数据库 / Mysql 阅读数: 1529
收藏 0 赞 0 分享
表结构:
mysql> desc demo;
+-------+------------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+-------+------------------+------+-----+---------+----------------+
| id | int(11) unsigned | NO | PRI | NULL | auto_increment |
| site | varchar(100) | NO | MUL | | |
+-------+------------------+------+-----+---------+----------------+
2 rows in set (0.00 sec)

数据:
mysql> select * from demo order by id;
+----+------------------------+
| id | site |
+----+------------------------+
| 1 | http://www.CodeBit.cn |
| 2 | http://YITU.org |
| 3 | http://www.ShuoWen.org |
| 4 | http://www.CodeBit.cn |
| 5 | http://www.ShuoWen.org |
+----+------------------------+
5 rows in set (0.00 sec)

当没有创建表或创建索引权限的时候,可以用下面的方法:

如果你要删除较旧的重复记录,可以使用下面的语句:
mysql> delete from a
-> using demo as a, demo as b
-> where (a.id > b.id)
-> and (a.site = b.site);
Query OK, 2 rows affected (0.12 sec)

mysql> select * from demo order by id;
+----+------------------------+
| id | site |
+----+------------------------+
| 1 | http://www.CodeBit.cn |
| 2 | http://YITU.org |
| 3 | http://www.ShuoWen.org |
+----+------------------------+
3 rows in set (0.00 sec)

如果你要删除较新的重复记录,可以使用下面的语句:
mysql> delete from a
-> using demo as a, demo as b
-> where (a.id < b.id)
-> and (a.site = b.site);
Query OK, 2 rows affected (0.12 sec)

mysql> select * from demo order by id;
+----+------------------------+
| id | site |
+----+------------------------+
| 2 | http://YITU.org |
| 4 | http://www.CodeBit.cn |
| 5 | http://www.ShuoWen.org |
+----+------------------------+
3 rows in set (0.00 sec)

你可以用下面的语句先确认将被删除的重复记录:
mysql> SELECT a.*
-> FROM demo a, demo b
-> WHERE a.id > b.id
-> AND (a.site = b.site);
+----+------------------------+
| id | site |
+----+------------------------+
| 1 | http://www.CodeBit.cn |
| 3 | http://www.ShuoWen.org |
+----+------------------------+
2 rows in set (0.00 sec)

如果有创建索引的权限,可以用下面的方法:

在表上创建唯一键索引:

 
mysql> alter ignore table demo add unique index ukey (site); 
Query OK, 5 rows affected (0.46 sec) 
Records: 5 Duplicates: 2 Warnings: 0 

mysql> select * from demo order by id; 
+----+------------------------+ 
| id | site | 
+----+------------------------+ 
| 1 | http://www.CodeBit.cn | 
| 2 | http://YITU.org | 
| 3 | http://www.ShuoWen.org | 
+----+------------------------+ 
3 rows in set (0.00 sec) 

重复记录被删除后,如果需要,可以删除索引:

 
mysql> alter table demo drop index ukey; 
Query OK, 3 rows affected (0.37 sec) 
Records: 3 Duplicates: 0 Warnings: 0 

如果有创建表的权限,可以用下面的方法:

创建一个新表,然后将原表中不重复的数据插入新表:

 
mysql> create table demo_new as select * from demo group by site; 
Query OK, 3 rows affected (0.19 sec) 
Records: 3 Duplicates: 0 Warnings: 0 

mysql> show tables; 
+----------------+ 
| Tables_in_test | 
+----------------+ 
| demo | 
| demo_new | 
+----------------+ 
2 rows in set (0.00 sec) 

mysql> select * from demo order by id; 
+----+------------------------+ 
| id | site | 
+----+------------------------+ 
| 1 | http://www.CodeBit.cn | 
| 2 | http://YITU.org | 
| 3 | http://www.ShuoWen.org | 
| 4 | http://www.CodeBit.cn | 
| 5 | http://www.ShuoWen.org | 
+----+------------------------+ 
5 rows in set (0.00 sec) 

mysql> select * from demo_new order by id; 
+----+------------------------+ 
| id | site | 
+----+------------------------+ 
| 1 | http://www.CodeBit.cn | 
| 2 | http://YITU.org | 
| 3 | http://www.ShuoWen.org | 
+----+------------------------+ 
3 rows in set (0.00 sec) 

然后将原表备份,将新表重命名为当前表:

 
mysql> rename table demo to demo_old, demo_new to demo; 
Query OK, 0 rows affected (0.04 sec) 

mysql> show tables; 
+----------------+ 
| Tables_in_test | 
+----------------+ 
| demo | 
| demo_old | 
+----------------+ 
2 rows in set (0.00 sec) 

mysql> select * from demo order by id; 
+----+------------------------+ 
| id | site | 
+----+------------------------+ 
| 1 | http://www.CodeBit.cn | 
| 2 | http://YITU.org | 
| 3 | http://www.ShuoWen.org | 
+----+------------------------+ 
3 rows in set (0.00 sec) 

注意:使用这种方式创建的表会丢失原表的索引信息!

 
mysql> desc demo; 
+-------+------------------+------+-----+---------+-------+ 
| Field | Type | Null | Key | Default | Extra | 
+-------+------------------+------+-----+---------+-------+ 
| id | int(11) unsigned | NO | | 0 | | 
| site | varchar(100) | NO | | | | 
+-------+------------------+------+-----+---------+-------+ 
2 rows in set (0.00 sec) 

如果要保持和原表信息一致,你可以使用 show create table demo; 来查看原表的创建语句,然后使用原表的创建语句创建新表,接着使用 insert … select 语句插入数据,再重命名表即可。

当然,如果要避免重复记录,最好的办法还是不要插入重复数据,可以参考本站另外一篇文章:MySQL 当记录不存在时插入

更多精彩内容其他人还在看

简单了解标准SQL的update语句三种用法

这篇文章主要介绍了简单了解标准SQL的update语句三种用法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,,需要的朋友可以参考下
收藏 0 赞 0 分享

MySQL5.7.23解压版安装教程图文详解

这篇文章主要介绍了MySQL5.7.23解压版安装教程图文详解,本文图文并茂给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
收藏 0 赞 0 分享

python 连接数据库mysql解压版安装配置及遇到问题

今天学习python连接数据库,就想安装一下mysql数据库,没想到小小的数据库也遇到了不少挫折,所以我就把自己的安装过程以及问题写出来分享给大家,需要的朋友可以参考下
收藏 0 赞 0 分享

为什么说MySQL单表数据不要超过500万行

在本篇文章里小编给大家整理了一篇关于为什么说MySQL单表数据不要超过500万行的相关内容,有兴趣的朋友们阅读下吧。
收藏 0 赞 0 分享

基于python的mysql复制工具详解

python-mysql-replication 是基于python实现的 MySQL复制协议工具,我们可以用它来解析binlog 获取日志的insert,update,delete等事件 ,并基于此做其他业务需求。这篇文章主要介绍了基于python的mysql复制工具,需要的朋
收藏 0 赞 0 分享

mysql语句查询用户权限过程详解

这篇文章主要介绍了mysql语句查询用户权限过程详解,授予用户的权限可能分全局层级权限、数据库层级权限、表层级别权限、列层级别权限、子程序层级权限。,需要的朋友可以参考下
收藏 0 赞 0 分享

MySQL创建数据表并建立主外键关系详解

这篇文章主要介绍了MySQL创建数据表并建立主外键关系详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
收藏 0 赞 0 分享

MySQL表中添加时间戳的几种方法

这篇文章主要介绍了MySQL表中添加时间戳的几种方法,有张表的数据需要用同步工具同步至其他库,需要 update_time 时间戳字段 来做增量同步,需要的朋友可以参考下
收藏 0 赞 0 分享

MySQL如何实现负载均衡功能

这篇文章主要介绍了MySQL如何实现负载均衡功能,学习过数据库的朋友们都会知道MySQL,那么如何在MySQL下实现负载均衡功能呢?本文就将为大家细致地介绍一下
收藏 0 赞 0 分享

mysql server 5.5连接不上的解决方法

这篇文章主要为大家详细介绍了mysql server 5.5连接不上的解决方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
收藏 0 赞 0 分享
查看更多