pandas 0.23 - DataFrame.aggregate()

pandas.DataFrame.aggregate




pandas

pandas.DataFrame.aggregate

DataFrame.aggregate(func, axis=0, *args, **kwargs) [source]

निर्दिष्ट अक्ष पर एक या एक से अधिक ऑपरेशन का उपयोग करके अलग करें।

संस्करण में नया 0.20.0।

पैरामीटर:

func : फ़ंक्शन, स्ट्रिंग, शब्दकोश, या स्ट्रिंग / फ़ंक्शन की सूची

डेटा एकत्र करने के लिए उपयोग करने का कार्य। यदि कोई फ़ंक्शन है, तो या तो काम करना चाहिए जब एक DataFrame पास हो या जब DataFrame.apply को पास किया जाए। यदि DataFrame स्तंभ नाम हैं, तो एक DataFrame के लिए, एक तानाशाही पास कर सकता है।

स्वीकृत संयोजन हैं:

  • स्ट्रिंग फ़ंक्शन का नाम।
  • समारोह।
  • कार्यों की सूची।
  • स्तंभ नामों का अधिमान -> फ़ंक्शंस (या फ़ंक्शंस की सूची)।

अक्ष : {0 या 'इंडेक्स', 1 या 'कॉलम'}, डिफ़ॉल्ट 0

  • 0 या 'इंडेक्स': प्रत्येक कॉलम में फंक्शन लागू करें।
  • 1 या 'कॉलम': प्रत्येक पंक्ति में फ़ंक्शन लागू करें।

* args

func पास करने के लिए स्थिति संबंधी तर्क।

** kwargs

func को पास करने के लिए कीवर्ड तर्क।

यह दिखाता है:
aggregated : DataFrame

यह भी देखें

DataFrame.apply
किसी भी प्रकार का ऑपरेशन करें।
DataFrame.transform
ट्रांसफॉर्मेशन टाइप ऑपरेशन करें।
pandas.core.groupby.GroupBy
समूहों पर कार्रवाई करें।
pandas.core.resample.Resampler
फिर से शुरू होने वाले डिब्बे पर कार्रवाई करें।
pandas.core.window.Rolling
रोलिंग विंडो पर संचालन करें।
pandas.core.window.Expanding
विंडो का विस्तार करने के लिए ऑपरेशन करें।
pandas.core.window.EWM
घातीय भारित खिड़की पर ऑपरेशन करें।

टिप्पणियाँ

agg aggregate लिए एक उपनाम है। उपनाम का उपयोग करें।

एक पारित उपयोगकर्ता-परिभाषित-फ़ंक्शन मूल्यांकन के लिए एक श्रृंखला पारित किया जाएगा।

एकत्रीकरण संचालन हमेशा एक अक्ष पर किया जाता है, या तो सूचकांक (डिफ़ॉल्ट) या स्तंभ अक्ष। यह व्यवहार numpy एकत्रीकरण कार्यों ( mean , median , prod , sum , std , var ) से अलग है, जहां डिफ़ॉल्ट रूप से चपटा सरणी के उदाहरण की गणना करने के लिए है, जैसे, numpy.mean(arr_2d) numpy.mean(arr_2d, axis=0)

agg aggregate लिए एक उपनाम है। उपनाम का उपयोग करें।

उदाहरण

>>> df = pd.DataFrame([[1, 2, 3],
...                    [4, 5, 6],
...                    [7, 8, 9],
...                    [np.nan, np.nan, np.nan]],
...                   columns=['A', 'B', 'C'])

पंक्तियों पर इन कार्यों को अलग करें।

>>> df.agg(['sum', 'min'])
        A     B     C
sum  12.0  15.0  18.0
min   1.0   2.0   3.0

प्रति कॉलम अलग-अलग एकत्रीकरण।

>>> df.agg({'A' : ['sum', 'min'], 'B' : ['min', 'max']})
        A    B
max   NaN  8.0
min   1.0  2.0
sum  12.0  NaN

स्तंभों पर एकत्र होना।

>>> df.agg("mean", axis="columns")
0    2.0
1    5.0
2    8.0
3    NaN
dtype: float64