來源丨JAVA葵花寶典
知識這個東西,看來真的要溫故而知新,一直不用,都要忘記了
業(yè)務很簡單:需要批量插入一些數(shù)據(jù),數(shù)據(jù)來源可能是其他數(shù)據(jù)庫的表,也可能是一個外部excel的導入
那么問題來了,是不是每次插入之前都要查一遍,看看重不重復,在代碼里篩選一下數(shù)據(jù),重復的就過濾掉呢?
向大數(shù)據(jù)數(shù)據(jù)庫中插入值時,還要判斷插入是否重復,然后插入。如何提高效率
看來這個問題不止我一個人苦惱過。
解決的辦法有很多種,不同的場景解決方案也不一樣,數(shù)據(jù)量很小的情況下,怎么搞都行,但是數(shù)據(jù)量很大的時候,這就不是一個簡單的問題了。
幾百萬的數(shù)據(jù),不可能查出來,做去重處理
說一下我Google到的解決方案
1、insert ignore into
當插入數(shù)據(jù)時,如出現(xiàn)錯誤時,如重復數(shù)據(jù),將不返回錯誤,只以警告形式返回。所以使用ignore請確保語句本身沒有問題,否則也會被忽略掉。例如:
INSERT IGNORE INTO user (name) VALUES (‘telami’)
這種方法很簡便,但是有一種可能,就是插入不是因為重復數(shù)據(jù)報錯,而是因為其他原因報錯的,也同樣被忽略了~
2、on duplicate key update
當primary或者unique重復時,則執(zhí)行update語句,如update后為無用語句,如id=id,則同1功能相同,但錯誤不會被忽略掉。
例如,為了實現(xiàn)name重復的數(shù)據(jù)插入不報錯,可使用一下語句:
INSERT INTO user (name) VALUES (‘telami’) ON duplicate KEY UPDATE id = id
這種方法有個前提條件,就是,需要插入的約束,需要是主鍵或者唯一約束(在你的業(yè)務中那個要作為唯一的判斷就將那個字段設置為唯一約束也就是unique key)。
3、insert … select … where not exist
根據(jù)select的條件判斷是否插入,可以不光通過primary 和unique來判斷,也可通過其它條件。例如:
INSERT INTO user (name) SELECT ‘telami’ FROM dual WHERE NOT EXISTS (SELECT id FROM user WHERE id = 1)
這種方法其實就是使用了mysql的一個臨時表的方式,但是里面使用到了子查詢,效率也會有一點點影響,如果能使用上面的就不使用這個。
4、replace into
如果存在primary or unique相同的記錄,則先刪除掉。再插入新記錄。
REPLACE INTO user SELECT 1, ‘telami’ FROM books
這種方法就是不管原來有沒有相同的記錄,都會先刪除掉然后再插入。
實踐
選擇的是第二種方式
這里用的是Mybatis,批量插入的一個操作,mobile_number 已經(jīng)加了唯一約束。這樣在批量插入時,如果存在手機號相同的話,是不會再插入了的。
責任編輯:gt
-
數(shù)據(jù)庫
+關注
關注
7文章
3925瀏覽量
66176 -
大數(shù)據(jù)
+關注
關注
64文章
8959瀏覽量
140144
原文標題:MySQL 批量插入:如何不插入重復數(shù)據(jù)?
文章出處:【微信號:AndroidPush,微信公眾號:Android編程精選】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
MySQL數(shù)據(jù)備份與恢復策略
MySQL數(shù)據(jù)庫是什么
CYUSB3014在FPGA發(fā)送的每兩幀有效數(shù)據(jù)之間,會出現(xiàn)很多冗余的重復數(shù)據(jù),問題出在哪里?
labview求助:想寫一個labview輸出不重復隨機數(shù)的程序,有沒有大佬幫忙看看這個假分支要怎么寫?
labview怎么輸出不重復的整數(shù)隨機數(shù)
使用插件將Excel連接到MySQL/MariaDB

適用于MySQL和MariaDB的Python連接器:可靠的MySQL數(shù)據(jù)連接器和數(shù)據(jù)庫

MySQL數(shù)據(jù)庫的安裝

數(shù)據(jù)庫數(shù)據(jù)恢復—Mysql數(shù)據(jù)庫表記錄丟失的數(shù)據(jù)恢復流程

評論