duplicates 중복제거 count - SQL 테이블에서 중복 값 찾기





12 Answers

이 시도:

declare @YourTable table (id int, name varchar(10), email varchar(50))

INSERT @YourTable VALUES (1,'John','John-email')
INSERT @YourTable VALUES (2,'John','John-email')
INSERT @YourTable VALUES (3,'fred','John-email')
INSERT @YourTable VALUES (4,'fred','fred-email')
INSERT @YourTable VALUES (5,'sam','sam-email')
INSERT @YourTable VALUES (6,'sam','sam-email')

SELECT
    name,email, COUNT(*) AS CountOf
    FROM @YourTable
    GROUP BY name,email
    HAVING COUNT(*)>1

산출:

name       email       CountOf
---------- ----------- -----------
John       John-email  2
sam        sam-email   2

(2 row(s) affected)

dups의 ID를 사용하려면 다음을 사용하십시오.

SELECT
    y.id,y.name,y.email
    FROM @YourTable y
        INNER JOIN (SELECT
                        name,email, COUNT(*) AS CountOf
                        FROM @YourTable
                        GROUP BY name,email
                        HAVING COUNT(*)>1
                    ) dt ON y.name=dt.name AND y.email=dt.email

산출:

id          name       email
----------- ---------- ------------
1           John       John-email
2           John       John-email
5           sam        sam-email
6           sam        sam-email

(4 row(s) affected)

중복을 삭제하려고 시도 :

DELETE d
    FROM @YourTable d
        INNER JOIN (SELECT
                        y.id,y.name,y.email,ROW_NUMBER() OVER(PARTITION BY y.name,y.email ORDER BY y.name,y.email,y.id) AS RowRank
                        FROM @YourTable y
                            INNER JOIN (SELECT
                                            name,email, COUNT(*) AS CountOf
                                            FROM @YourTable
                                            GROUP BY name,email
                                            HAVING COUNT(*)>1
                                        ) dt ON y.name=dt.name AND y.email=dt.email
                   ) dt2 ON d.id=dt2.id
        WHERE dt2.RowRank!=1
SELECT * FROM @YourTable

산출:

id          name       email
----------- ---------- --------------
1           John       John-email
3           fred       John-email
4           fred       fred-email
5           sam        sam-email

(4 row(s) affected)
mssql 데이터 하나만

하나의 필드로 duplicates 것을 쉽게 찾을 수 있습니다.

SELECT name, COUNT(email) 
FROM users
GROUP BY email
HAVING COUNT(email) > 1

그래서 테이블이 있다면

ID   NAME   EMAIL
1    John   asd@asd.com
2    Sam    asd@asd.com
3    Tom    asd@asd.com
4    Bob    bob@asd.com
5    Tom    asd@asd.com

이 쿼리는 John, Sam, Tom, Tom 모두에게 동일한 email 이 있기 때문에 제공됩니다.

그러나, 내가 원하는 것은 동일한 emailname 중복 된 것을 얻는 것입니다.

즉, 저는 "Tom", "Tom"을 얻고 싶습니다.

내가 이것을 필요로하는 이유 : 나는 실수를했고 중복되는 nameemail 값을 삽입하는 것을 허용했다. 이제 사본을 제거 / 변경 해야하므로 먼저 사본을 찾아야 합니다.




중복을 삭제하려면 짝수 / 홀수 행을 트리플 하위 선택으로 찾아야하는 것보다 훨씬 간단한 방법이 있습니다.

SELECT id, name, email 
FROM users u, users u2
WHERE u.name = u2.name AND u.email = u2.email AND u.id > u2.id

삭제할 수 있습니다.

DELETE FROM users
WHERE id IN (
    SELECT id/*, name, email*/
    FROM users u, users u2
    WHERE u.name = u2.name AND u.email = u2.email AND u.id > u2.id
)

IMHO를 읽고 이해하는 것이 훨씬 쉬워졌습니다.

참고 : 유일한 문제는 삭제 된 행이 없어 질 때까지 요청을 실행해야한다는 것입니다. 매번 각 복제본 중 하나만 삭제하기 때문입니다




 SELECT name, email 
    FROM users
    WHERE email in
    (SELECT email FROM users
    GROUP BY email 
    HAVING COUNT(*)>1)



이 코드를 시험해 보라.

WITH CTE AS

( SELECT Id, Name, Age, Comments, RN = ROW_NUMBER()OVER(PARTITION BY Name,Age ORDER BY ccn)
FROM ccnmaster )
select * from CTE 



이렇게하면 각 중복 그룹에서 하나의 레코드를 제외한 모든 중복 레코드를 선택 / 삭제합니다. 따라서 삭제는 모든 고유 레코드 + 중복 된 각 그룹의 레코드 하나를 남겨 둡니다.

중복 항목 선택 :

SELECT *
FROM table
WHERE
    id NOT IN (
        SELECT MIN(id)
        FROM table
        GROUP BY column1, column2
);

중복 삭제 :

DELETE FROM table
WHERE
    id NOT IN (
        SELECT MIN(id)
        FROM table
        GROUP BY column1, column2
);

더 많은 양의 레코드를 인식하면 성능 문제가 발생할 수 있습니다.




select id,name,COUNT(*) from India group by Id,Name having COUNT(*)>1



SELECT id, COUNT(id) FROM table1 GROUP BY id HAVING COUNT(id)>1;

나는 이것이 특정 열의 반복 된 값을 검색하는 데 제대로 작동 할 것이라고 생각한다.




select name, email
, case 
when ROW_NUMBER () over (partition by name, email order by name) > 1 then 'Yes'
else 'No'
end "duplicated ?"
from users



이것은 또한 작동해야합니다, 어쩌면 그것을 시도하십시오.

  Select * from Users a
            where EXISTS (Select * from Users b 
                where (     a.name = b.name 
                        OR  a.email = b.email)
                     and a.ID != b.id)

당신의 경우에 특히 좋다 어떤 종류의 접두어 나 일반적인 변경 사항 (예 : 메일의 새로운 도메인)이있는 중복을 검색하는 경우. 그런 다음이 열에서 replace ()를 사용할 수 있습니다.




하나 또는 여러 기준으로 중복 데이터를 찾고 실제 행을 선택하려는 경우

with MYCTE as (
    SELECT DuplicateKey1
        ,DuplicateKey2 --optional
        ,count(*) X
    FROM MyTable
    group by DuplicateKey1, DuplicateKey2
    having count(*) > 1
) 
SELECT E.*
FROM MyTable E
JOIN MYCTE cte
ON E.DuplicateKey1=cte.DuplicateKey1
    AND E.DuplicateKey2=cte.DuplicateKey2
ORDER BY E.DuplicateKey1, E.DuplicateKey2, CreatedAt

http://developer.azurewebsites.net/2014/09/better-sql-group-by-find-duplicate-data/




SELECT column_name,COUNT(*) FROM TABLE_NAME GROUP BY column1, HAVING COUNT(*) > 1;




테이블에 중복 레코드를 얻는 방법

SELECT COUNT (코드), 직원 코드 WHERE 상태 = 1 GROUP BY 코드 COUNT (코드)> 1




Related