99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何過(guò)濾掉MySQL大批量插入的重復(fù)數(shù)據(jù)

阿銘linux ? 來(lái)源:CSDN ? 作者:CSDN ? 2021-08-27 11:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

線(xiàn)上庫(kù)有6個(gè)表存在重復(fù)數(shù)據(jù),其中2個(gè)表比較大,一個(gè)96萬(wàn)+、一個(gè)30萬(wàn)+,因?yàn)橹疤幚磉^(guò)相同的問(wèn)題,就直接拿來(lái)了上次的Python去重腳本,腳本很簡(jiǎn)單,就是連接數(shù)據(jù)庫(kù),查出來(lái)重復(fù)數(shù)據(jù),循環(huán)刪除。

emmmm,但是這個(gè)效率嘛,實(shí)在是太低了,1秒一條,重復(fù)數(shù)據(jù)大約2萬(wàn)+,預(yù)估時(shí)間大約在8個(gè)小時(shí)左右。。。

盲目依靠前人的東西,而不去自己思考是有問(wèn)題的!總?cè)ハ胫霸趺纯梢裕F(xiàn)在怎么不行了,這也是有問(wèn)題的!我發(fā)現(xiàn),最近確實(shí)狀態(tài)不太對(duì),失去了探索和求知的欲望,今天算是一個(gè)警醒,頗有迷途知返的感覺(jué)。

言歸正傳,下面詳細(xì)介紹去重步驟

CREATE TABLE `animal` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(20) DEFAULT NULL, `age` int(11) DEFAULT NULL, PRIMARY KEY (`id`)) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

INSERT INTO `pilipa_dds`。`student` (`id`, `name`, `age`) VALUES (‘1’, ‘cat’, ‘12’);INSERT INTO `pilipa_dds`。`student` (`id`, `name`, `age`) VALUES (‘2’, ‘dog’, ‘13’);INSERT INTO `pilipa_dds`。`student` (`id`, `name`, `age`) VALUES (‘3’, ‘camel’, ‘25’);INSERT INTO `pilipa_dds`。`student` (`id`, `name`, `age`) VALUES (‘4’, ‘cat’, ‘32’);INSERT INTO `pilipa_dds`。`student` (`id`, `name`, `age`) VALUES (‘5’, ‘dog’, ‘42’);

目標(biāo):我們要去掉name相同的數(shù)據(jù)

先看看哪些數(shù)據(jù)重復(fù)了

SELECT name,count( 1 ) FROM student GROUP BYNAME HAVING count( 1 ) 》 1;

輸出:

name count(1) cat 2 dog 2

name為cat和dog的數(shù)據(jù)重復(fù)了,每個(gè)重復(fù)的數(shù)據(jù)有兩條;

Select * From 表 Where 重復(fù)字段 In (Select 重復(fù)字段 From 表 Group By 重復(fù)字段 Having Count(1)》1)

刪除全部重復(fù)數(shù)據(jù),一條不留

直接刪除會(huì)報(bào)錯(cuò)

DELETE FROM student WHERE NAME IN ( SELECT NAME FROM student GROUP BY NAME HAVING count( 1 ) 》 1)

報(bào)錯(cuò):

1093 - You can‘t specify target table ’student‘ for update in FROM clause, Time: 0.016000s

原因是:更新這個(gè)表的同時(shí)又查詢(xún)了這個(gè)表,查詢(xún)這個(gè)表的同時(shí)又去更新了這個(gè)表,可以理解為死鎖。mysql不支持這種更新查詢(xún)同一張表的操作

解決辦法:把要更新的幾列數(shù)據(jù)查詢(xún)出來(lái)做為一個(gè)第三方表,然后篩選更新。

DELETE FROM student WHERE NAME IN ( SELECT t.NAME FROM ( SELECT NAME FROM student GROUP BY NAME HAVING count( 1 ) 》 1 ) t)

刪除表中刪除重復(fù)數(shù)據(jù),僅保留一條

在刪除之前,我們可以先查一下,我們要?jiǎng)h除的重復(fù)數(shù)據(jù)是啥樣的

SELECT * FROM student WHERE id NOT IN ( SELECT t.id FROM ( SELECT MIN( id ) AS id FROM student GROUP BY `name` ) t )

啥意思呢,就是先通過(guò)name分組,查出id最小的數(shù)據(jù),這些數(shù)據(jù)就是我們要留下的火種,那么再查詢(xún)出id不在這里面的,就是我們要?jiǎng)h除的重復(fù)數(shù)據(jù)。

開(kāi)始刪除重復(fù)數(shù)據(jù),僅留一條

很簡(jiǎn)單,剛才的select換成delete即可

DELETE FROM student WHERE id NOT IN ( SELECT t.id FROM ( SELECT MIN( id ) AS id FROM student GROUP BY `name` ) t )

90萬(wàn)+的表執(zhí)行起來(lái)超級(jí)快。

(版權(quán)歸原作者所有,侵刪)

來(lái)源:telami.cn/2019/mysql-removes-duplicate-data-and-keeping-only-one/

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91919
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86799
  • 腳本
    +關(guān)注

    關(guān)注

    1

    文章

    398

    瀏覽量

    28476

原文標(biāo)題:MySQL 大批量插入,如何過(guò)濾掉重復(fù)數(shù)據(jù)?

文章出處:【微信號(hào):aming_linux,微信公眾號(hào):阿銘linux】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    應(yīng)用案例丨一鍵測(cè)量300+工件,QM系列閃測(cè)儀批量檢測(cè)

    面對(duì)制造業(yè)大批量、高效率的尺寸檢測(cè)需求,光子精密推出了革命性產(chǎn)品——QM系列圖像尺寸測(cè)量?jī)x。憑借±1μm的超高測(cè)量精度、行業(yè)領(lǐng)先的大批量檢測(cè)能力,重新定義尺寸檢測(cè)的效率標(biāo)準(zhǔn)。
    的頭像 發(fā)表于 07-18 08:00 ?83次閱讀
    應(yīng)用案例丨一鍵測(cè)量300+工件,QM系列閃測(cè)儀<b class='flag-5'>批量</b>檢測(cè)

    批量SMT加工的“定制化”與大批量生產(chǎn)的“標(biāo)準(zhǔn)化”:差異全解析

    一站式PCBA加工廠家今天為大家講講小批量SMT加工與大批量生產(chǎn)有什么區(qū)別?小批量SMT加工與大批量生產(chǎn)差異解析。 ? 一、SMT加工的核心模式差異 1. 生產(chǎn)規(guī)模與設(shè)備配置 小
    的頭像 發(fā)表于 07-16 09:18 ?119次閱讀

    MySQL數(shù)據(jù)備份與恢復(fù)策略

    數(shù)據(jù)是企業(yè)的核心資產(chǎn),MySQL作為主流的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),其數(shù)據(jù)的安全性和可靠性至關(guān)重要。本文將深入探討MySQL
    的頭像 發(fā)表于 07-14 11:11 ?137次閱讀

    企業(yè)級(jí)MySQL數(shù)據(jù)庫(kù)管理指南

    在當(dāng)今數(shù)字化時(shí)代,MySQL作為全球最受歡迎的開(kāi)源關(guān)系型數(shù)據(jù)庫(kù),承載著企業(yè)核心業(yè)務(wù)數(shù)據(jù)的存儲(chǔ)與處理。作為數(shù)據(jù)庫(kù)管理員(DBA),掌握MySQL
    的頭像 發(fā)表于 07-09 09:50 ?139次閱讀

    MySQL數(shù)據(jù)庫(kù)是什么

    MySQL數(shù)據(jù)庫(kù)是一種 開(kāi)源的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)(RDBMS) ,由瑞典MySQL AB公司開(kāi)發(fā),后被Oracle公司收購(gòu)。它通過(guò)結(jié)構(gòu)化查詢(xún)語(yǔ)言(SQL)進(jìn)行
    的頭像 發(fā)表于 05-23 09:18 ?456次閱讀

    CYUSB3014在FPGA發(fā)送的每?jī)蓭行?b class='flag-5'>數(shù)據(jù)之間,會(huì)出現(xiàn)很多冗余的重復(fù)數(shù)據(jù),問(wèn)題出在哪里?

    使用BeginDataXfer(), WaitForXfer() 和 FinishDataXfer()的方法異步接收數(shù)據(jù)。目前C#端的吞吐量大于FPGA數(shù)據(jù)的發(fā)送速率,我們發(fā)現(xiàn)在FPGA發(fā)送的每?jī)蓭行?b class='flag-5'>數(shù)據(jù)之間,會(huì)出現(xiàn)很多冗余的
    發(fā)表于 05-20 07:36

    使用插件將Excel連接到MySQL/MariaDB

    處理 MySQL 數(shù)據(jù),進(jìn)行數(shù)據(jù)清理和重復(fù)數(shù)據(jù)刪除。 直接從 Excel 連接到 MySQL 要將 Excel 連接到
    的頭像 發(fā)表于 01-20 12:38 ?630次閱讀
    使用插件將Excel連接到<b class='flag-5'>MySQL</b>/MariaDB

    適用于MySQL和MariaDB的Python連接器:可靠的MySQL數(shù)據(jù)連接器和數(shù)據(jù)庫(kù)

    和 Linux 的 wheel 包分發(fā)。 直接連接 該解決方案使您能夠通過(guò) TCP/IP 建立與 MySQL 或者 MariaDB 數(shù)據(jù)庫(kù)服務(wù)器的直接連接,而無(wú)需數(shù)據(jù)庫(kù)客戶(hù)端庫(kù)。另外直接連接可以提高 Python 應(yīng)用程
    的頭像 發(fā)表于 01-17 12:18 ?501次閱讀
    適用于<b class='flag-5'>MySQL</b>和MariaDB的Python連接器:可靠的<b class='flag-5'>MySQL</b><b class='flag-5'>數(shù)據(jù)</b>連接器和<b class='flag-5'>數(shù)據(jù)</b>庫(kù)

    MySQL數(shù)據(jù)庫(kù)的安裝

    MySQL數(shù)據(jù)庫(kù)的安裝 【一】各種數(shù)據(jù)庫(kù)的端口 MySQL :3306 Redis :6379 MongoDB :27017 Django :8000 flask :5000 【二】
    的頭像 發(fā)表于 01-14 11:25 ?566次閱讀
    <b class='flag-5'>MySQL</b><b class='flag-5'>數(shù)據(jù)</b>庫(kù)的安裝

    嵐圖汽車(chē)獲TüV南德大批量WVTA證書(shū),加速全球化進(jìn)程

    在全球化浪潮下,中國(guó)汽車(chē)品牌正迎來(lái)前所未有的出海與升級(jí)機(jī)遇。近日,嵐圖汽車(chē)科技有限公司的嵐圖知音全球版COURAGE高端純電SUV成功獲得全球知名第三方檢測(cè)認(rèn)證機(jī)構(gòu)TüV南德意志集團(tuán)頒發(fā)的歐盟大批量
    的頭像 發(fā)表于 01-02 13:59 ?858次閱讀

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Mysql數(shù)據(jù)庫(kù)表記錄丟失的數(shù)據(jù)恢復(fù)流程

    Mysql數(shù)據(jù)庫(kù)故障: Mysql數(shù)據(jù)庫(kù)表記錄丟失。 Mysql數(shù)據(jù)庫(kù)故障表現(xiàn): 1、
    的頭像 發(fā)表于 12-16 11:05 ?617次閱讀
    <b class='flag-5'>數(shù)據(jù)</b>庫(kù)<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—<b class='flag-5'>Mysql</b><b class='flag-5'>數(shù)據(jù)</b>庫(kù)表記錄丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)流程

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—MYSQL數(shù)據(jù)庫(kù)ibdata1文件損壞的數(shù)據(jù)恢復(fù)案例

    mysql數(shù)據(jù)庫(kù)故障: mysql數(shù)據(jù)庫(kù)文件ibdata1、MYI、MYD損壞。 故障表現(xiàn):1、數(shù)據(jù)庫(kù)無(wú)法進(jìn)行查詢(xún)等操作;2、使用my
    的頭像 發(fā)表于 12-09 11:05 ?636次閱讀

    PCM5100A可以播放出20khz以上的信號(hào)嗎?

    如題 高于20Khz的信號(hào)會(huì)不會(huì)被過(guò)濾掉 比如 芯片內(nèi)置了截止頻率20khz左右的低通濾波器之類(lèi)的...... 想用這芯片做個(gè)信號(hào)源
    發(fā)表于 10-25 07:00

    TLV320AIC3104將所有輸入斷開(kāi)在i2s輸出仍然有波型,可以通過(guò)寄存器設(shè)置過(guò)濾掉嗎?

    TLV320AIC3104 將所有輸入斷開(kāi)在i2s 輸出仍然有波型。 這可以通過(guò)寄存器設(shè)置過(guò)濾掉嗎? ps:采集音頻是沒(méi)問(wèn)題的 但是不接輸入時(shí),輸出會(huì)聽(tīng)到一個(gè)很細(xì)小尖銳的聲音 嘗試修改PGA 增益調(diào)小無(wú)明顯改善
    發(fā)表于 10-18 06:36

    低至160元/㎡! 華秋PCB中大批量階梯價(jià)來(lái)了,以量定價(jià)!

    在競(jìng)爭(zhēng)激烈的市場(chǎng)中客戶(hù)的產(chǎn)品如何實(shí)現(xiàn)成本優(yōu)化與效率提升?華秋PCB為您帶來(lái)了革命性的解決方案中、大批量階梯價(jià)策略!以量定價(jià)→讓您的每一次采購(gòu)都成為節(jié)省成本的機(jī)會(huì)。PriceReduction單面
    的頭像 發(fā)表于 09-27 08:02 ?865次閱讀
    低至160元/㎡! 華秋PCB中<b class='flag-5'>大批量</b>階梯價(jià)來(lái)了,以量定價(jià)!