SQL 之 删除没有临时表的重复行

作为开发人员,我们经常遇到必须处理数据库相关内容的情况。通常,当客户端以excel工作表的形式向您发送其数据,并且在经过一些excel操作后将数据推送到数据库表时,便完成了该操作。我也做了很多次。

这种方法面临的一个非常普遍的问题是,有时可能会导致重复行,因为发送的数据主要来自人力资源和财务等部门,而人们对这些数据标准化技术的了解并不多。

我将使用Employee表,其中的列名称为id,名称,部门和电子邮件。

以下是用于生成测试数据的SQL脚本。

创建模式TestDB;

创建表格员工
    ID INT,
    名称Varchar(100),
    部门情报,
    电子邮件Varchar(100)
);

插入员工值(1,'Anish',101,'anish @ how2codex.com');
插入员工值(2,'Lokesh',102,'lokesh @ how2codex.com');
插入员工值(3,'Rakesh',103,'rakesh @ how2codex.com');
插入员工值(4,'Yogesh',104,'yogesh @ how2codex.com');

-这些是重复的行

插入员工值(5,'Anish',101,'anish @ how2codex.com');
插入员工值(6,'Lokesh',102,'lokesh @ how2codex.com');

解:

从员工e1和员工e2中删除e1,其中e1.name = e2.name AND e1.id> e2.id;

上面的sql查询将删除名称字段重复的行,并且仅保留那些名称唯一且ID字段最低的唯一行。例如,ID为5和6的行将被删除,而ID为1和2的行将被保留。

在mysql中删除重复行

如果要保留具有最新生成的ID值的行,则将where子句中的条件反转为e1.id <e2.id,如下所示:

从员工e1和员工e2中删除e1,其中e1.name = e2.name AND e1.id> e2.id;

如果要比较多个字段并添加适当的where子句。

注意:请始终首先对测试数据执行以上(或修改的)查询,以确保其产生预期的输出。

学习愉快!

This entry was posted in   SQL.
Bookmark the   permalink.

saigon has written 1440 articles

Leave a Reply