pandas 0.23 - DataFrame.nlargest()
pandas.DataFrame.nlargest

pandas.DataFrame.nlargest
-
DataFrame.nlargest(n, columns, keep='first')
[source] -
अवरोही क्रम में
columns
द्वारा आदेशित पहलीn
पंक्तियों को लौटाएं।अवरोही क्रम में,
columns
में सबसे बड़े मानों के साथ पहलीn
पंक्तियाँ लौटाएँ। जो कॉलम निर्दिष्ट नहीं हैं, उन्हें भी लौटा दिया जाता है, लेकिन ऑर्डर करने के लिए उपयोग नहीं किया जाता है।यह विधि
df.sort_values(columns, ascending=False).head(n)
, लेकिन अधिक महत्वपूर्ण।पैरामीटर: n : int
लौटने के लिए पंक्तियों की संख्या।
कॉलम : लेबल या लेबल की सूची
द्वारा ऑर्डर करने के लिए कॉलम लेबल।
रखना : {'पहले', 'अंतिम'}, डिफ़ॉल्ट 'पहला'
जहां डुप्लिकेट मान हैं:
-
first
: पहली घटना को प्राथमिकता दें -
last
: पिछली घटना को प्राथमिकता दें
यह दिखाता है: डेटा ढांचा
अवरोही क्रम में दिए गए कॉलम द्वारा आदेशित पहली
n
पंक्तियाँ।यह भी देखें
-
DataFrame.nsmallest
-
आरोही क्रम में
columns
द्वारा दिए गए पहलेn
पंक्तियों को लौटाएं। -
DataFrame.sort_values
- मानों द्वारा DataFrame सॉर्ट करें
-
DataFrame.head
-
पुन: आदेश के बिना पहले
n
पंक्तियों को वापस करें।
टिप्पणियाँ
इस फ़ंक्शन का उपयोग सभी स्तंभ प्रकारों के साथ नहीं किया जा सकता है। उदाहरण के लिए,
object
याcategory
dtypes के साथ कॉलम निर्दिष्ट करते समय,TypeError
को उठाया जाता है।उदाहरण
>>> df = pd.DataFrame({'a': [1, 10, 8, 10, -1], ... 'b': list('abdce'), ... 'c': [1.0, 2.0, np.nan, 3.0, 4.0]}) >>> df a b c 0 1 a 1.0 1 10 b 2.0 2 8 d NaN 3 10 c 3.0 4 -1 e 4.0
निम्नलिखित उदाहरण में, हम कॉलम "सबसे" में सबसे बड़ा मान रखने वाली तीन पंक्तियों का चयन करने के लिए
nlargest
का उपयोग करेंगे।>>> df.nlargest(3, 'a') a b c 1 10 b 2.0 3 10 c 3.0 2 8 d NaN
जब
keep='last'
का उपयोग करते हुए, रिवर्स ऑर्डर में संबंधों को हल किया जाता है:>>> df.nlargest(3, 'a', keep='last') a b c 3 10 c 3.0 1 10 b 2.0 2 8 d NaN
कॉलम "ए" और फिर "सी" में सबसे बड़े मूल्यों द्वारा ऑर्डर करने के लिए, हम अगले उदाहरण में कई कॉलम निर्दिष्ट कर सकते हैं।
>>> df.nlargest(3, ['a', 'c']) a b c 3 10 c 3.0 1 10 b 2.0 2 8 d NaN
गैर-सांख्यिक
nlargest
परnlargest
से अधिक का उपयोग करने का प्रयास करने से एकTypeError
बढ़ेगी:>>> df.nlargest(3, 'b') Traceback (most recent call last): TypeError: Column 'b' has dtype object, cannot use method 'nlargest'
-