pandas 0.23 - Index.duplicated()

pandas.Index.duplicated




pandas

pandas.Index.duplicated

Index.duplicated(keep='first') [source]

डुप्लिकेट इंडेक्स मानों को इंगित करें।

परिणामी सरणी में डुप्लिकेट किए गए मान को True मान के रूप में इंगित किया गया है। या तो सभी डुप्लिकेट, पहले को छोड़कर सभी, या डुप्लिकेट की अंतिम घटना को छोड़कर सभी को इंगित किया जा सकता है।

पैरामीटर:

रखना : {'पहले', 'अंतिम', गलत}, डिफ़ॉल्ट 'पहला'

लापता के रूप में चिह्नित करने के लिए डुप्लिकेट के एक सेट में मूल्य या मूल्य।

  • 'पहला': मार्क पहली घटना को छोड़कर True रूप में दोहराता है।
  • 'अंतिम': मार्क अंतिम घटना को छोड़कर True रूप में दोहराता है।
  • False : सभी डुप्लिकेट को True रूप में चिह्नित करें।
यह दिखाता है:
numpy.ndarray

यह भी देखें

pandas.Series.duplicated
पंडों पर समान पद्धति
pandas.DataFrame.duplicated
पंडों पर समतुल्य विधि। DataFrame
pandas.Index.drop_duplicates
अनुक्रमणिका से डुप्लिकेट मान निकालें

उदाहरण

डिफ़ॉल्ट रूप से, डुप्लिकेट मानों के प्रत्येक सेट के लिए, पहली घटना झूठी और अन्य सभी को सही पर सेट की जाती है:

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> idx.duplicated()
array([False, False,  True, False,  True])

के बराबर है

>>> idx.duplicated(keep='first')
array([False, False,  True, False,  True])

'अंतिम' का उपयोग करके, डुप्लिकेट मानों के प्रत्येक सेट की अंतिम घटना को गलत पर और अन्य सभी को सही पर सेट किया जाता है:

>>> idx.duplicated(keep='last')
array([ True, False,  True, False, False])

False रखने के लिए, सभी डुप्लिकेट सच हैं:

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])