sql - uguali - Come posso trovare valori duplicati in una tabella in Oracle?




sql trovare record duplicati (8)

Qual è l'istruzione SQL più semplice che restituirà i valori duplicati per una determinata colonna e il conteggio delle loro occorrenze in una tabella di database Oracle?

Ad esempio: ho una tabella JOBS con la colonna JOB_NUMBER . Come faccio a sapere se ho JOB_NUMBER duplicati e quante volte sono duplicati?


Che ne dite di:

SELECT <column>, count(*)
FROM <table>
GROUP BY <column> HAVING COUNT(*) > 1;

Per rispondere all'esempio sopra, sembrerebbe:

SELECT job_number, count(*)
FROM jobs
GROUP BY job_number HAVING COUNT(*) > 1;

Di solito uso la funzione analitica Oracle ROW_NUMBER() .

Supponiamo che tu voglia controllare i duplicati che hai riguardo a un indice univoco o a una chiave primaria costruita su colonne ( c1 , c2 , c3 ). Quindi andrai in questo modo, facendo apparire ROWID s di righe in cui il numero di righe portato da ROW_NUMBER() è >1 :

Select * From Table_With_Duplicates
      Where Rowid In
                    (Select Rowid
                       From (Select Rowid,
                                    ROW_NUMBER() Over (
                                            Partition By c1 || c2 || c3
                                            Order By c1 || c2 || c3
                                        ) nbLines
                               From Table_With_Duplicates) t2
                      Where nbLines > 1)

Il più semplice mi viene in mente:

select job_number, count(*)
from jobs
group by job_number
having count(*) > 1;

Nel caso in cui più colonne identificano una riga univoca (ad es. Una tabella delle relazioni), è possibile utilizzare la seguente

Utilizzare l'id riga eg emp_dept (empid, deptid, startdate, enddate) supponiamo che empid e deptid siano univoci e identificano la riga in quel caso

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.rowid <> ied.rowid and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

e se tale tabella ha la chiave primaria, utilizzare la chiave primaria invece di rowid, ad es. id is pk then

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.id <> ied.id and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

Puoi anche provare qualcosa di simile per elencare tutti i valori duplicati in una tabella, come reqitem

SELECT count(poid) 
FROM poitem 
WHERE poid = 50 
AND rownum < any (SELECT count(*)  FROM poitem WHERE poid = 50) 
GROUP BY poid 
MINUS
SELECT count(poid) 
FROM poitem 
WHERE poid in (50)
GROUP BY poid 
HAVING count(poid) > 1;

Un altro modo:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

Funziona bene (abbastanza veloce) quando c'è indice su column_name . Ed è il modo migliore per eliminare o aggiornare le righe duplicate.


1. soluzione

select * from emp
    where rowid not in
    (select max(rowid) from emp group by empno);

SELECT   SocialSecurity_Number, Count(*) no_of_rows
FROM     SocialSecurity 
GROUP BY SocialSecurity_Number
HAVING   Count(*) > 1
Order by Count(*) desc 






duplicate-data