pandas 0.23 - Series.drop_duplicates()

pandas.Series.drop_duplicates




pandas

pandas.Series.drop_duplicates

Series.drop_duplicates(keep='first', inplace=False) [source]

डुप्लिकेट मानों के साथ वापसी श्रृंखला हटा दी गई।

पैरामीटर:

रखना : {'पहले', 'अंतिम', False }, डिफ़ॉल्ट 'पहला'

  • 'पहला': पहली घटना को छोड़कर डुप्लिकेट को छोड़ दें।
  • 'अंतिम': अंतिम घटना को छोड़कर डुप्लिकेट को छोड़ दें।
  • False : सभी डुप्लिकेट ड्रॉप करें।

निष्क्रिय : बूलियन, डिफ़ॉल्ट False

यदि यह True , तो ऑपरेशन इनप्लेस करता है और कोई नहीं लौटाता है।

यह दिखाता है:
deduplicated : Series

यह भी देखें

Index.drop_duplicates
सूचकांक पर समतुल्य विधि
DataFrame.drop_duplicates
DataFrame पर समतुल्य विधि
Series.duplicated
श्रृंखला पर संबंधित विधि, डुप्लिकेट श्रृंखला मूल्यों का संकेत।

उदाहरण

डुप्लिकेट प्रविष्टियों के साथ एक श्रृंखला बनाएं।

>>> s = pd.Series(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'],
...               name='animal')
>>> s
0      lama
1       cow
2      lama
3    beetle
4      lama
5     hippo
Name: animal, dtype: object

'कीप' पैरामीटर के साथ, डुप्लिकेट किए गए मानों के चयन व्यवहार को बदला जा सकता है। मूल्य 'पहले' डुप्लिकेट प्रविष्टियों के प्रत्येक सेट के लिए पहली घटना रखता है। रखने का डिफ़ॉल्ट मान 'पहला' है।

>>> s.drop_duplicates()
0      lama
1       cow
3    beetle
5     hippo
Name: animal, dtype: object

'पैरामीटर' के लिए 'अंतिम' मान 'डुप्लिकेट प्रविष्टियों के प्रत्येक सेट के लिए अंतिम घटना रखता है।

>>> s.drop_duplicates(keep='last')
1       cow
3    beetle
4      lama
5     hippo
Name: animal, dtype: object

पैरामीटर 'कीप' के लिए False मूल्य डुप्लिकेट प्रविष्टियों के सभी सेटों को अलग करता है। True ऑपरेशन को 'inplace' की वैल्यू सेट करने से ऑपरेशन ऑलआउट होता है और None लौटता।

>>> s.drop_duplicates(keep=False, inplace=True)
>>> s
1       cow
3    beetle
5     hippo
Name: animal, dtype: object