pandas 0.23 - DataFrame.nlargest()

pandas.DataFrame.nlargest




pandas

pandas.DataFrame.nlargest

DataFrame.nlargest(n, columns, keep='first') [source]

अवरोही क्रम में columns द्वारा आदेशित पहली n पंक्तियों को लौटाएं।

अवरोही क्रम में, columns में सबसे बड़े मानों के साथ पहली n पंक्तियाँ लौटाएँ। जो कॉलम निर्दिष्ट नहीं हैं, उन्हें भी लौटा दिया जाता है, लेकिन ऑर्डर करने के लिए उपयोग नहीं किया जाता है।

यह विधि df.sort_values(columns, ascending=False).head(n) , लेकिन अधिक महत्वपूर्ण।

पैरामीटर:

n : int

लौटने के लिए पंक्तियों की संख्या।

कॉलम : लेबल या लेबल की सूची

द्वारा ऑर्डर करने के लिए कॉलम लेबल।

रखना : {'पहले', 'अंतिम'}, डिफ़ॉल्ट 'पहला'

जहां डुप्लिकेट मान हैं:

  • first : पहली घटना को प्राथमिकता दें
  • last : पिछली घटना को प्राथमिकता दें
यह दिखाता है:

डेटा ढांचा

अवरोही क्रम में दिए गए कॉलम द्वारा आदेशित पहली n पंक्तियाँ।

यह भी देखें

DataFrame.nsmallest
आरोही क्रम में columns द्वारा दिए गए पहले n पंक्तियों को लौटाएं।
DataFrame.sort_values
मानों द्वारा DataFrame सॉर्ट करें
DataFrame.head
पुन: आदेश के बिना पहले n पंक्तियों को वापस करें।

टिप्पणियाँ

इस फ़ंक्शन का उपयोग सभी स्तंभ प्रकारों के साथ नहीं किया जा सकता है। उदाहरण के लिए, object या category dtypes के साथ कॉलम निर्दिष्ट करते समय, TypeError को उठाया जाता है।

उदाहरण

>>> df = pd.DataFrame({'a': [1, 10, 8, 10, -1],
...                    'b': list('abdce'),
...                    'c': [1.0, 2.0, np.nan, 3.0, 4.0]})
>>> df
    a  b    c
0   1  a  1.0
1  10  b  2.0
2   8  d  NaN
3  10  c  3.0
4  -1  e  4.0

निम्नलिखित उदाहरण में, हम कॉलम "सबसे" में सबसे बड़ा मान रखने वाली तीन पंक्तियों का चयन करने के लिए nlargest का उपयोग करेंगे।

>>> df.nlargest(3, 'a')
    a  b    c
1  10  b  2.0
3  10  c  3.0
2   8  d  NaN

जब keep='last' का उपयोग करते हुए, रिवर्स ऑर्डर में संबंधों को हल किया जाता है:

>>> df.nlargest(3, 'a', keep='last')
    a  b    c
3  10  c  3.0
1  10  b  2.0
2   8  d  NaN

कॉलम "ए" और फिर "सी" में सबसे बड़े मूल्यों द्वारा ऑर्डर करने के लिए, हम अगले उदाहरण में कई कॉलम निर्दिष्ट कर सकते हैं।

>>> df.nlargest(3, ['a', 'c'])
    a  b    c
3  10  c  3.0
1  10  b  2.0
2   8  d  NaN

गैर-सांख्यिक nlargest पर nlargest से अधिक का उपयोग करने का प्रयास करने से एक TypeError बढ़ेगी:

>>> df.nlargest(3, 'b')
Traceback (most recent call last):
TypeError: Column 'b' has dtype object, cannot use method 'nlargest'