duplicates امثلة - العثور على قيم مكررة في جدول SQL




جميع انواع (20)

تأخرت قليلاً للحفل ولكنني وجدت حلًا رائعًا حقًا للعثور على جميع المكوّنات المكررة:

SELECT GROUP_CONCAT( id )
FROM users
GROUP BY email
HAVING ( COUNT(email) > 1 )

من السهل العثور على duplicates حقل واحد:

SELECT name, COUNT(email) 
FROM users
GROUP BY email
HAVING COUNT(email) > 1

لذلك إذا كان لدينا طاولة

ID   NAME   EMAIL
1    John   [email protected]
2    Sam    [email protected]
3    Tom    [email protected]
4    Bob    [email protected]
5    Tom    [email protected]

سيقدم لنا هذا الاستفسار John، Sam، Tom، Tom لأنهم جميعًا لديهم نفس email .

ومع ذلك ، ما أريده هو الحصول على نسخ مكررة باستخدام نفس email name .

هذا هو ، أريد الحصول على "توم" ، "توم".

السبب في أنني بحاجة إلى هذا: لقد ارتكبت خطأ ، وسمحت بإدخال name مكرر وقيم email . الآن أحتاج إلى إزالة / تغيير التكرارات ، لذا يجب أن أجدها أولاً.


كيف يمكننا حساب القيم المكررة؟ إما أنها تتكرر مرتين أو أكثر من 2. فقط عدّها ، وليس مجموعة حكيمة.

ببساطة

select COUNT(distinct col_01) from Table_01

هذا يجب أن يعمل أيضا ، ربما محاولة إعطائها.

  Select * from Users a
            where EXISTS (Select * from Users b 
                where (     a.name = b.name 
                        OR  a.email = b.email)
                     and a.ID != b.id)

جيد بشكل خاص في حالتك إذا كنت تبحث عن النسخ المكررة التي لديها نوع من البادئة أو تغيير عام مثل على سبيل المثال ، نطاق جديد في البريد. ثم يمكنك استخدام replace () في هذه الأعمدة


جرب هذا الكود

WITH CTE AS

( SELECT Id, Name, Age, Comments, RN = ROW_NUMBER()OVER(PARTITION BY Name,Age ORDER BY ccn)
FROM ccnmaster )
select * from CTE 

SELECT * FROM users u where rowid = (select max(rowid) from users u1 where
u.email=u1.email);

SELECT
    name, email, COUNT(*)
FROM
    users
GROUP BY
    name, email
HAVING 
    COUNT(*) > 1

ببساطة مجموعة على كل من الأعمدة.

ملاحظة: معيار ANSI هو أن يكون جميع الأعمدة غير المجمعة في GROUP BY. يتيح لك MySQL تجنب هذا ، ولكن النتائج غير متوقعة:

في MySQL أنت بحاجة إلى sql_mode=only_full_group_by


في حال كنت تعمل مع شركة أوراكل ، فإن هذه الطريقة ستكون أفضل:

create table my_users(id number, name varchar2(100), email varchar2(100));

insert into my_users values (1, 'John', '[email protected]');
insert into my_users values (2, 'Sam', '[email protected]');
insert into my_users values (3, 'Tom', '[email protected]');
insert into my_users values (4, 'Bob', '[email protected]');
insert into my_users values (5, 'Tom', '[email protected]');

commit;

select *
  from my_users
 where rowid not in (select min(rowid) from my_users group by name, email);

SELECT column_name,COUNT(*) FROM TABLE_NAME GROUP BY column1, HAVING COUNT(*) > 1;


إذا كنت تريد البحث عن بيانات مكررة (بواسطة معيار واحد أو عدة معايير) وحدد الصفوف الفعلية.

with MYCTE as (
    SELECT DuplicateKey1
        ,DuplicateKey2 --optional
        ,count(*) X
    FROM MyTable
    group by DuplicateKey1, DuplicateKey2
    having count(*) > 1
) 
SELECT E.*
FROM MyTable E
JOIN MYCTE cte
ON E.DuplicateKey1=cte.DuplicateKey1
    AND E.DuplicateKey2=cte.DuplicateKey2
ORDER BY E.DuplicateKey1, E.DuplicateKey2, CreatedAt

http://developer.azurewebsites.net/2014/09/better-sql-group-by-find-duplicate-data/


جرب هذا:

declare @YourTable table (id int, name varchar(10), email varchar(50))

INSERT @YourTable VALUES (1,'John','John-email')
INSERT @YourTable VALUES (2,'John','John-email')
INSERT @YourTable VALUES (3,'fred','John-email')
INSERT @YourTable VALUES (4,'fred','fred-email')
INSERT @YourTable VALUES (5,'sam','sam-email')
INSERT @YourTable VALUES (6,'sam','sam-email')

SELECT
    name,email, COUNT(*) AS CountOf
    FROM @YourTable
    GROUP BY name,email
    HAVING COUNT(*)>1

انتاج:

name       email       CountOf
---------- ----------- -----------
John       John-email  2
sam        sam-email   2

(2 row(s) affected)

إذا كنت تريد استخدام معرفات الخوادم هذه:

SELECT
    y.id,y.name,y.email
    FROM @YourTable y
        INNER JOIN (SELECT
                        name,email, COUNT(*) AS CountOf
                        FROM @YourTable
                        GROUP BY name,email
                        HAVING COUNT(*)>1
                    ) dt ON y.name=dt.name AND y.email=dt.email

انتاج:

id          name       email
----------- ---------- ------------
1           John       John-email
2           John       John-email
5           sam        sam-email
6           sam        sam-email

(4 row(s) affected)

لحذف النسخة المكررة ، حاول:

DELETE d
    FROM @YourTable d
        INNER JOIN (SELECT
                        y.id,y.name,y.email,ROW_NUMBER() OVER(PARTITION BY y.name,y.email ORDER BY y.name,y.email,y.id) AS RowRank
                        FROM @YourTable y
                            INNER JOIN (SELECT
                                            name,email, COUNT(*) AS CountOf
                                            FROM @YourTable
                                            GROUP BY name,email
                                            HAVING COUNT(*)>1
                                        ) dt ON y.name=dt.name AND y.email=dt.email
                   ) dt2 ON d.id=dt2.id
        WHERE dt2.RowRank!=1
SELECT * FROM @YourTable

انتاج:

id          name       email
----------- ---------- --------------
1           John       John-email
3           fred       John-email
4           fred       fred-email
5           sam        sam-email

(4 row(s) affected)

هذا يحدد / يحذف جميع السجلات المكررة باستثناء سجل واحد من كل مجموعة من التكرارات. لذلك ، يترك الحذف كل السجلات الفريدة + سجل واحد من كل مجموعة من التكرارات.

حدد التكرارات:

SELECT *
FROM table
WHERE
    id NOT IN (
        SELECT MIN(id)
        FROM table
        GROUP BY column1, column2
);

حذف التكرارات:

DELETE FROM table
WHERE
    id NOT IN (
        SELECT MIN(id)
        FROM table
        GROUP BY column1, column2
);

كن على دراية بكميات أكبر من السجلات ، يمكن أن يسبب مشاكل في الأداء.


 SELECT name, email 
    FROM users
    WHERE email in
    (SELECT email FROM users
    GROUP BY email 
    HAVING COUNT(*)>1)

باستخدام CTE أيضا يمكننا أن نجد قيمة مكررة مثل هذا

with MyCTE
as
(
select Name,EmailId,ROW_NUMBER() over(PARTITION BY EmailId order by id) as Duplicate from [Employees]

)
select * from MyCTE where Duplicate>1

حاول القيام بما يلي:

SELECT * FROM
(
    SELECT Id, Name, Age, Comments, Row_Number() OVER(PARTITION BY Name, Age ORDER By Name)
        AS Rank 
        FROM Customers
) AS B WHERE Rank>1

 select emp.ename, emp.empno, dept.loc 
          from emp
 inner join dept 
          on dept.deptno=emp.deptno
 inner join
    (select ename, count(*) from
    emp
    group by ename, deptno
    having count(*) > 1)
 t on emp.ename=t.ename order by emp.ename
/

select id,name,COUNT(*) from India group by Id,Name having COUNT(*)>1

select name, email
, case 
when ROW_NUMBER () over (partition by name, email order by name) > 1 then 'Yes'
else 'No'
end "duplicated ?"
from users

جرب هذا:

SELECT name, email
FROM users
GROUP BY name, email
HAVING ( COUNT(*) > 1 )

SELECT id, COUNT(id) FROM table1 GROUP BY id HAVING COUNT(id)>1;

أعتقد أن هذا سيعمل بشكل صحيح للبحث عن القيم المتكررة في عمود معين.


لنفترض أن لدينا جدول "طالب" مع عمودين:

  • student_id int
  • student_name varchar

    Records:
    +------------+---------------------+
    | student_id | student_name        |
    +------------+---------------------+
    |        101 | usman               |
    |        101 | usman               |
    |        101 | usman               |
    |        102 | usmanyaqoob         |
    |        103 | muhammadusmanyaqoob |
    |        103 | muhammadusmanyaqoob |
    +------------+---------------------+
    

الآن نريد أن نرى سجلات مكررة استخدم هذا الاستعلام:

select student_name,student_id ,count(*) c from student group by student_id,student_name having c>1;

+---------------------+------------+---+
| student_name        | student_id | c |
+---------------------+------------+---+
| usman               |        101 | 3 |
| muhammadusmanyaqoob |        103 | 2 |
+---------------------+------------+---+




sql duplicates