pandas 0.23 - pandas.unique()

pandas.unique




pandas

pandas.unique

pandas.unique(values) [source]

हैश तालिका आधारित अद्वितीय। उपस्थिति के क्रम में यूनियनों को वापस कर दिया जाता है। यह सॉर्ट नहीं करता है।

सुन्न से अधिक तेजी से। NA मान शामिल हैं।

पैरामीटर:
values : 1d array-like
यह दिखाता है:

अद्वितीय मूल्य।

  • यदि इनपुट एक इंडेक्स है, तो रिटर्न एक इंडेक्स है
  • यदि इनपुट एक श्रेणीबद्ध dtype है, तो रिटर्न एक श्रेणीगत है
  • यदि इनपुट एक श्रृंखला / ndarray है, तो रिटर्न एक ndarray होगा

यह भी देखें

pandas.Index.unique , pandas.Series.unique

उदाहरण

>>> pd.unique(pd.Series([2, 1, 3, 3]))
array([2, 1, 3])
>>> pd.unique(pd.Series([2] + [1] * 5))
array([2, 1])
>>> pd.unique(Series([pd.Timestamp('20160101'),
...                   pd.Timestamp('20160101')]))
array(['2016-01-01T00:00:00.000000000'], dtype='datetime64[ns]')
>>> pd.unique(pd.Series([pd.Timestamp('20160101', tz='US/Eastern'),
...                      pd.Timestamp('20160101', tz='US/Eastern')]))
array([Timestamp('2016-01-01 00:00:00-0500', tz='US/Eastern')],
      dtype=object)
>>> pd.unique(pd.Index([pd.Timestamp('20160101', tz='US/Eastern'),
...                     pd.Timestamp('20160101', tz='US/Eastern')]))
DatetimeIndex(['2016-01-01 00:00:00-05:00'],
...           dtype='datetime64[ns, US/Eastern]', freq=None)
>>> pd.unique(list('baabc'))
array(['b', 'a', 'c'], dtype=object)

एक अनियंत्रित श्रेणीबद्ध उपस्थिति के क्रम में श्रेणियां लौटाएगा।

>>> pd.unique(Series(pd.Categorical(list('baabc'))))
[b, a, c]
Categories (3, object): [b, a, c]
>>> pd.unique(Series(pd.Categorical(list('baabc'),
...                                 categories=list('abc'))))
[b, a, c]
Categories (3, object): [b, a, c]

एक आदेश दिया गया श्रेणी श्रेणी के आदेश को संरक्षित करता है।

>>> pd.unique(Series(pd.Categorical(list('baabc'),
...                                 categories=list('abc'),
...                                 ordered=True)))
[b, a, c]
Categories (3, object): [a < b < c]

एक प्रकार का पौधा

>>> pd.unique([('a', 'b'), ('b', 'a'), ('a', 'c'), ('b', 'a')])
array([('a', 'b'), ('b', 'a'), ('a', 'c')], dtype=object)