pandas 0.23 - Index.drop_duplicates()

pandas.Index.drop_duplicates




pandas

pandas.Index.drop_duplicates

Index.drop_duplicates(keep='first') [source]

डुप्लिकेट मानों के साथ वापसी सूचकांक हटा दिया गया।

पैरामीटर:

रखना : {'पहले', 'अंतिम', False }, डिफ़ॉल्ट 'पहला'

  • 'पहला': पहली घटना को छोड़कर डुप्लिकेट को छोड़ दें।
  • 'अंतिम': अंतिम घटना को छोड़कर डुप्लिकेट को छोड़ दें।
  • False : सभी डुप्लिकेट ड्रॉप करें।
यह दिखाता है:
deduplicated : Index

यह भी देखें

Series.drop_duplicates
श्रृंखला पर समतुल्य विधि
DataFrame.drop_duplicates
DataFrame पर समतुल्य विधि
Index.duplicated
सूचकांक पर संबंधित विधि, डुप्लिकेट सूचकांक मूल्यों का संकेत।

उदाहरण

डुप्लिकेट मान के साथ एक पांडा उत्पन्न करें।

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'])

पैरामीटर पैरामीटर को नियंत्रित करें जो डुप्लिकेट मान हटा दिए जाते हैं। मूल्य 'पहले' डुप्लिकेट प्रविष्टियों के प्रत्येक सेट के लिए पहली घटना रखता है। रखने का डिफ़ॉल्ट मान 'पहला' है।

>>> idx.drop_duplicates(keep='first')
Index(['lama', 'cow', 'beetle', 'hippo'], dtype='object')

मूल्य 'अंतिम' डुप्लिकेट प्रविष्टियों के प्रत्येक सेट के लिए अंतिम घटना रखता है।

>>> idx.drop_duplicates(keep='last')
Index(['cow', 'beetle', 'lama', 'hippo'], dtype='object')

मूल्य False डुप्लिकेट प्रविष्टियों के सभी सेटों को छोड़ देता है।

>>> idx.drop_duplicates(keep=False)
Index(['cow', 'beetle', 'hippo'], dtype='object')