一次現(xiàn)場mysql重復記錄數(shù)據(jù)的排查處理實戰(zhàn)記錄
我當時正好出差在客戶現(xiàn)場部署調(diào)試軟件,有一天客戶突然找到我這里,說他們現(xiàn)場生產(chǎn)的數(shù)據(jù)出現(xiàn)了異常的情況,最直接的表現(xiàn)就是 同一個標簽,出現(xiàn)在了多個物料上,需要我配合,看怎么排查問題
分析
客戶當時直接一摞重復標簽的盒子碼在我面前,我慌得一匹,這怕不是捅婁子了
稍加思索,現(xiàn)在需要做的就是,在數(shù)據(jù)庫中查詢出重復的標簽,即對一個標簽進行統(tǒng)計,判斷出計數(shù)> 1 的即可
emmm,語法錯誤,我記得還有個Having 來著,換上試試
好家伙,重復的標簽有 1500 多條,再統(tǒng)計一下總共問題的記錄數(shù)量,以及再分組看看標簽重復次數(shù)的占比數(shù)據(jù)
對了,先把這些重復標簽數(shù)據(jù)扔個客戶去追溯產(chǎn)品(幸好 navicat 支持復制數(shù)據(jù))
數(shù)據(jù)總計
以上一條查詢記錄的結(jié)果為臨時表,在此基礎上,用 sum() 求和
重復的記錄有點多,這問題有一點點大了
重復次數(shù)占比
對之前的查詢表換一個查詢方式,即對 count 數(shù)據(jù)再次分組
從結(jié)果來看,絕大部分問題數(shù)據(jù)重復了2次
where 和 having 的區(qū)別
Where是一個 約束聲明,在查詢數(shù)據(jù)庫的結(jié)果返回之前對數(shù)據(jù)庫中的查詢條件進行約束,即在結(jié)果返回之前起作用,且where后面 不能使用聚合函數(shù)
Having是一個 過濾聲明,所謂過濾是 在查詢數(shù)據(jù)庫的結(jié)果返回之后進行過濾,即在結(jié)果返回之后起作用,并且having后面可以使用聚合函數(shù)。
所謂 聚合函數(shù),是對一組值進行計算并且返回單一值的函數(shù):sum---求和,count---計數(shù),max---最大值,avg---平均值等。
總結(jié)
在 mysql 的查詢操作中,我們?nèi)粘S玫降?,一般都是多表?lián)查,將查詢的結(jié)果當成中間表進行多次查詢,對查詢的結(jié)果做分組,做統(tǒng)計匯總等操作
如果查詢操作中使用了函數(shù)計算或者是分組,典型的特征就是將原始表的多條記錄合并成一條,就需要 having 對這些操作的結(jié)果進行過濾,除此之外,使用 where 對表記錄進行條件過濾即可
到此這篇關于現(xiàn)場mysql重復記錄數(shù)據(jù)的排查處理記錄的文章就介紹到這了,更多相關mysql重復記錄數(shù)據(jù)排查處理內(nèi)容請搜索本站以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持本站!
版權聲明:本站文章來源標注為YINGSOO的內(nèi)容版權均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務器上建立鏡像,否則將依法追究法律責任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學習參考,不代表本站立場,如有內(nèi)容涉嫌侵權,請聯(lián)系alex-e#qq.com處理。