[sql] Come posso trovare valori duplicati in una tabella in Oracle?


Answers

Un altro modo:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

Funziona bene (abbastanza veloce) quando c'è indice su column_name . Ed è il modo migliore per eliminare o aggiornare le righe duplicate.

Question

Qual è l'istruzione SQL più semplice che restituirà i valori duplicati per una determinata colonna e il conteggio delle loro occorrenze in una tabella di database Oracle?

Ad esempio: ho una tabella JOBS con la colonna JOB_NUMBER . Come faccio a sapere se ho JOB_NUMBER duplicati e quante volte sono duplicati?




SELECT   SocialSecurity_Number, Count(*) no_of_rows
FROM     SocialSecurity 
GROUP BY SocialSecurity_Number
HAVING   Count(*) > 1
Order by Count(*) desc 



Puoi anche provare qualcosa di simile per elencare tutti i valori duplicati in una tabella, come reqitem

SELECT count(poid) 
FROM poitem 
WHERE poid = 50 
AND rownum < any (SELECT count(*)  FROM poitem WHERE poid = 50) 
GROUP BY poid 
MINUS
SELECT count(poid) 
FROM poitem 
WHERE poid in (50)
GROUP BY poid 
HAVING count(poid) > 1;



Nel caso in cui più colonne identificano una riga univoca (ad es. Una tabella delle relazioni), è possibile utilizzare la seguente

Utilizzare l'id riga eg emp_dept (empid, deptid, startdate, enddate) supponiamo che empid e deptid siano univoci e identificano la riga in quel caso

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.rowid <> ied.rowid and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

e se tale tabella ha la chiave primaria, utilizzare la chiave primaria invece di rowid, ad es. id is pk then

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.id <> ied.id and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);



Non è necessario avere il conteggio nelle colonne restituite se non è necessario conoscere il numero effettivo di duplicati. per esempio

SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1



Ecco una richiesta SQL per farlo:

select column_name, count(1)
from table
group by column_name
having count (column_name) > 1;



Related