本教學將向您展示在MySQL中刪除重複行的各種方法。
在上一個教學中,我們向您展示了如何在表中找到重複的值。當確定了表中有重複的行,您可能需要刪除它們來清理這些不必要的資料。
以下指令碼建立contacts
表,並將範例資料插入到用於演示的contacts
表中。
USE testdb;
DROP TABLE IF EXISTS contacts;
CREATE TABLE contacts (
id INT PRIMARY KEY AUTO_INCREMENT,
first_name VARCHAR(50) DEFAULT NULL,
last_name VARCHAR(50) DEFAULT NULL,
email VARCHAR(255) NOT NULL
);
INSERT INTO contacts (first_name,last_name,email)
VALUES ('Carine ','Schmitt','[email protected]'),
('Jean','King','[email protected]'),
('Peter','Ferguson','[email protected]'),
('Janine ','Labrune','[email protected]'),
('Jonas ','Bergulfsen','[email protected]'),
('Janine ','Labrune','[email protected]'),
('Susan','Nelson','[email protected]'),
('Zbyszek ','Piestrzeniewicz','[email protected]'),
('Roland','Keitel','[email protected]'),
('Julie','Murphy','[email protected]'),
('Kwai','Lee','[email protected]'),
('Jean','King','[email protected]'),
('Susan','Nelson','[email protected]'),
('Roland','Keitel','[email protected]');
執行DELETE語句後,可以執行此指令碼來重新建立測試資料。
以下查詢返回contacts
表中的重複email
值:
SELECT
email, COUNT(email)
FROM
contacts
GROUP BY email
HAVING COUNT(email) > 1;
執行上面查詢語句,得到以下結果 -
+-------------------------+--------------+
| email | COUNT(email) |
+-------------------------+--------------+
| [email protected] | 2 |
| [email protected] | 2 |
| [email protected] | 2 |
+-------------------------+--------------+
3 rows in set
可以看到,表中有重複email
行記錄。
使用DELETE JOIN語句刪除重複的行
MySQL為您提供了可用於快速刪除重複行的DELETE JOIN語句。
以下語句刪除重複的行並保持最高的ID:
DELETE t1 FROM contacts t1
INNER JOIN
contacts t2
WHERE
t1.id < t2.id AND t1.email = t2.email;
Query OK, 3 rows affected
如上所示,有3
行記錄已被刪除。我們再次執行查詢重複的電子郵件的查詢:
SELECT
email, COUNT(email)
FROM
contacts
GROUP BY email
HAVING COUNT(email) > 1;
該查詢返回一個空集合,這意味著重複的行已被刪除。
我們來查詢驗證contacts
表中的資料:
SELECT
*
FROM
contacts;
ID
為4
,7
和9
的行記錄已被刪除。
如果要刪除重複的行並保留最低的ID
,則可以使用以下語句:
DELETE t1 FROM contacts t1
INNER JOIN
contacts t2
WHERE
t1.id > t2.id AND t1.email = t2.email;
可以再次執行建立contacts
表的指令碼並測試此查詢,以下輸出顯示刪除重複行後的contacts
表的資料。
使用直接表刪除重複的行
以下是使用直接表刪除重複行的步驟:
以下查詢說明了以下步驟:
步驟1 -
CREATE TABLE source_copy FROM source;
步驟2 -
INSERT INTO source_copy
SELECT * FROM source
GROUP BY col; -- column that has duplicate values
步驟3 -
DROP TABLE source;
ALTER TABLE source_copy RENAME TO source;
例如,以下語句從contacts
表中刪除具有重複電子郵件(email
)的行記錄:
-- step 1
CREATE TABLE contacts_temp
LIKE contacts;
-- step 2
INSERT INTO contacts_temp(email) SELECT email FROM contacts GROUP BY email;
-- step 3
DROP TABLE contacts;
ALTER TABLE contacts_temp
RENAME TO contacts;
在本教學中,您已經學習了如何使用DELETE JOIN
語句或直接表刪除MySQL中的重複行。