pandas 0.23 - Index.get_duplicates()

pandas.Index.get_duplicates




pandas

pandas.Index.get_duplicates

Index.get_duplicates() [source]

डुप्लिकेट इंडेक्स तत्वों को निकालें।

सूचकांक तत्वों की एक क्रमबद्ध सूची देता है जो सूचकांक में एक से अधिक बार दिखाई देता है।

संस्करण 0.23.0 के बाद से पदावनत: इसके बजाय idx [idx.duplicated ()] अद्वितीय () का उपयोग करें

यह दिखाता है:

सरणी की तरह

डुप्लिकेट इंडेक्स की सूची।

यह भी देखें

Index.duplicated
डुप्लिकेट को दर्शाते हुए बूलियन सरणी लौटें।
Index.drop_duplicates
डुप्लिकेट हटाए गए के साथ वापसी सूचकांक।

उदाहरण

विभिन्न प्रकार के सूचकांक पर काम करता है।

>>> pd.Index([1, 2, 2, 3, 3, 3, 4]).get_duplicates()
[2, 3]
>>> pd.Index([1., 2., 2., 3., 3., 3., 4.]).get_duplicates()
[2.0, 3.0]
>>> pd.Index(['a', 'b', 'b', 'c', 'c', 'c', 'd']).get_duplicates()
['b', 'c']

ध्यान दें कि एक DatetimeIndex के लिए, यह एक सूची नहीं बल्कि एक नया DatetimeIndex लौटाता है:

>>> dates = pd.to_datetime(['2018-01-01', '2018-01-02', '2018-01-03',
...                         '2018-01-03', '2018-01-04', '2018-01-04'],
...                        format='%Y-%m-%d')
>>> pd.Index(dates).get_duplicates()
DatetimeIndex(['2018-01-03', '2018-01-04'],
              dtype='datetime64[ns]', freq=None)

अनुक्रमणिका के विकार रहित होने पर भी डुप्लिकेट तत्वों को सॉर्ट करता है।

>>> pd.Index([1, 2, 3, 2, 3, 4, 3]).get_duplicates()
[2, 3]

सभी तत्व अद्वितीय होने पर खाली सरणी जैसी संरचना लौटाएं।

>>> pd.Index([1, 2, 3, 4]).get_duplicates()
[]
>>> dates = pd.to_datetime(['2018-01-01', '2018-01-02', '2018-01-03'],
...                        format='%Y-%m-%d')
>>> pd.Index(dates).get_duplicates()
DatetimeIndex([], dtype='datetime64[ns]', freq=None)