亚洲午夜日韩高清一区,国产精品丝袜在线观看,国产成人午夜视频

今天小編要跟大家分享的文章是關(guān)于運(yùn)維人員該如何查找并刪除數(shù)據(jù)庫(kù)中的重復(fù)行。本文講述如何查找數(shù)據(jù)庫(kù)里重復(fù)的行。這是初學(xué)者十分普遍遇到的問(wèn)題。方法也很簡(jiǎn)單。這個(gè)問(wèn)題還可以有其他演變，例如，如何查找“兩字段重復(fù)的行”。Linux入門(mén)新手和正在Linux學(xué)習(xí)的小伙伴快來(lái)看一看吧，希望能夠?qū)Υ蠹矣兴鶐椭?/p>

1、如何查找重復(fù)行

第一步是定義什么樣的行才是重復(fù)行。多數(shù)情況下很簡(jiǎn)單：它們某一列具有相同的值。本文采用這一定義，或許你對(duì)“重復(fù)”的定義比這復(fù)雜，你需要對(duì)sql做些修改。本文要用到的數(shù)據(jù)樣本：

前面兩行在day字段具有相同的值，因此如何我將他們當(dāng)做重復(fù)行，這里有一查詢語(yǔ)句可以查找。查詢語(yǔ)句使用GROUP BY子句把具有相同字段值的行歸為一組，然后計(jì)算組的大小。

重復(fù)行的組大小大于1。如何希望只顯示重復(fù)行，必須使用HAVING子句，比如

這是基本的技巧：根據(jù)具有相同值的字段分組，然后知顯示大小大于1的組。

為什么不能使用WHERE子句？因?yàn)閃HERE子句過(guò)濾的是分組之前的行，HAVING子句過(guò)濾的是分組之后的行。

2、如何刪除重復(fù)行

一個(gè)相關(guān)的問(wèn)題是如何刪除重復(fù)行。一個(gè)常見(jiàn)的任務(wù)是，重復(fù)行只保留一行，其他刪除，然后你可以創(chuàng)建適當(dāng)?shù)乃饕乐挂院笤儆兄貜?fù)的行寫(xiě)入數(shù)據(jù)庫(kù)。

同樣，首先是弄清楚重復(fù)行的定義。你要保留的是哪一行呢？第一行，或者某個(gè)字段具有最大值的行？本文中，假設(shè)要保留的是第一行——id字段具有最小值的行，意味著你要?jiǎng)h除其他的行。

也許最簡(jiǎn)單的方法是通過(guò)臨時(shí)表。尤其對(duì)于MYSQL，有些限制是不能在一個(gè)查詢語(yǔ)句中select的同時(shí)update一個(gè)表。簡(jiǎn)單起見(jiàn)，這里只用到了臨時(shí)表的方法。

我們的任務(wù)是：刪除所有重復(fù)行，除了分組中id字段具有最小值的行。因此，需要找出大小大于1的分組，以及希望保留的行。你可以使用MIN()函數(shù)。這里的語(yǔ)句是創(chuàng)建臨時(shí)表，以及查找需要用DELETE刪除的行。

有了這些數(shù)據(jù)，你可以開(kāi)始刪除“臟數(shù)據(jù)”行了。可以有幾種方法，各有優(yōu)劣（詳見(jiàn)我的文章many-to-one problems in SQL），但這里不做詳細(xì)比較，只是說(shuō)明在支持查詢子句的關(guān)系數(shù)據(jù)庫(kù)中，使用的標(biāo)準(zhǔn)方法。

3、如何查找多列上的重復(fù)行

有人最近問(wèn)到這樣的問(wèn)題：我的一個(gè)表上有兩個(gè)字段b和c，分別關(guān)聯(lián)到其他兩個(gè)表的b和c字段。我想要找出在b字段或者c字段上具有重復(fù)值的行。

咋看很難明白，通過(guò)對(duì)話后我理解了：他想要對(duì)b和c分別創(chuàng)建unique索引。如上所述，查找在某一字段上具有重復(fù)值的行很簡(jiǎn)單，只要用group分組，然后計(jì)算組的大小。并且查找全部字段重復(fù)的行也很簡(jiǎn)單，只要把所有字段放到group子句。但如果是判斷b字段重復(fù)或者c字段重復(fù)，問(wèn)題困難得多。這里提問(wèn)者用到的樣本數(shù)據(jù)

現(xiàn)在，你可以輕易看到表里面有一些重復(fù)的行，但找不到兩行具有相同的二元組{b, c}。這就是為什么問(wèn)題會(huì)變得困難了。

錯(cuò)誤的查詢語(yǔ)句

如果把兩列放在一起分組，你會(huì)得到不同的結(jié)果，具體看如何分組和計(jì)算大小。提問(wèn)者恰恰是困在了這里。有時(shí)候查詢語(yǔ)句找到一些重復(fù)行卻漏了其他的。這是他用到了查詢??

結(jié)果返回所有的行，因?yàn)镃ONT(*)總是1.為什么？因?yàn)?gt;1寫(xiě)在COUNT()里面。這個(gè)錯(cuò)誤很容易被忽略，事實(shí)上等效于

為什么？因?yàn)?b > 1)是一個(gè)布爾值，根本不是你想要的結(jié)果。你要的是

返回空結(jié)果。很顯然，因?yàn)闆](méi)有重復(fù)的{b,c}。這人試了很多其他的OR和AND的組合，用來(lái)分組的是一個(gè)字段，計(jì)算大小的是另一個(gè)字段，像這樣

沒(méi)有一個(gè)能夠找出全部的重復(fù)行。而且最令人沮喪的是，對(duì)于某些情況，這種語(yǔ)句是有效的，如果錯(cuò)誤地以為就是這么寫(xiě)法，然而對(duì)于另外的情況，很可能得到錯(cuò)誤結(jié)果。

事實(shí)上，單純用GROUP BY是不可行的。為什么？因?yàn)楫?dāng)你對(duì)某一字段使用group by時(shí)，就會(huì)把另一字段的值分散到不同的分組里。對(duì)這些字段排序可以看到這些效果，正如分組做的那樣。首先，對(duì)b字段排序，看看它是如何分組的

當(dāng)你對(duì)b字段排序（分組），相同值的c被分到不同的組，因此不能用COUNT(DISTINCT c)來(lái)計(jì)算大小。COUNT()之類的內(nèi)部函數(shù)只作用于同一個(gè)分組，對(duì)于不同分組的行就無(wú)能為力了。類似，如果排序的是c字段，相同值的b也會(huì)分到不同的組，無(wú)論如何是不能達(dá)到我們的目的的。

幾種正確的方法

也許最簡(jiǎn)單的方法是分別對(duì)某個(gè)字段查找重復(fù)行，然后用UNION拼在一起，像這樣：

輸出what_col字段為了提示重復(fù)的是哪個(gè)字段。另一個(gè)辦法是使用嵌套查詢：

這種方法的效率要比使用UNION低許多，并且顯示每一重復(fù)的行，而不是重復(fù)的字段值。還有一種方法，將自己跟group的嵌套查詢結(jié)果聯(lián)表查詢。寫(xiě)法比較復(fù)雜，但對(duì)于復(fù)雜的數(shù)據(jù)或者對(duì)效率有較高要求的情況，是很有必要的。

以上方法可行，我敢肯定還有其他的方法。如果UNION能用，我想會(huì)是最簡(jiǎn)單不過(guò)的了。

以上就是小編今天為大家分享的關(guān)于運(yùn)維人員該如何查找并刪除數(shù)據(jù)庫(kù)中的重復(fù)行？的文章，希望本篇文章能夠?qū)φ趶氖逻\(yùn)維工作的小伙伴們有所幫助。想要了解更多運(yùn)維相關(guān)知識(shí)記得關(guān)注馬哥Linux培訓(xùn)官網(wǎng)，最后祝愿小伙伴們工作順利！

聲明：文章來(lái)源于網(wǎng)絡(luò)，侵刪！

久久国产乱子伦精品免费M,亚洲一区二区三区91,欧美国产在线视频,国产精品视频久久

運(yùn)維人員該如何查找并刪除數(shù)據(jù)庫(kù)中的重復(fù)行？

相關(guān)新聞