pandas 0.23 - DataFrame.groupby()

pandas.DataFrame.groupby




pandas

pandas.DataFrame.groupby

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs) [source]

मैपर (तानाशाही या मुख्य कार्य) का उपयोग करके समूह श्रृंखला, दिए गए फ़ंक्शन को समूह में लागू करें, श्रृंखला के रूप में परिणाम लौटाएं) या स्तंभों की एक श्रृंखला द्वारा।

पैरामीटर:

द्वारा : मानचित्रण, फ़ंक्शन, लेबल, या लेबल की सूची

समूह के लिए समूहों को निर्धारित करने के लिए उपयोग किया जाता है। यदि कोई फ़ंक्शन है, तो उसे ऑब्जेक्ट के इंडेक्स के प्रत्येक मान पर कॉल किया जाता है। यदि एक तानाशाही या श्रृंखला पारित की जाती है, तो समूहों को निर्धारित करने के लिए श्रृंखला या .align() उपयोग किया जाएगा (श्रृंखला के मूल्यों को गठबंधन किया जाता है; देखें .align() विधि)। यदि एक ndarray पारित किया जाता है, तो मानों का उपयोग समूहों के रूप में किया जाता है। एक लेबल या लेबल की सूची को self में कॉलम द्वारा समूह में पारित किया जा सकता है। ध्यान दें कि एक टपल की व्याख्या एक (एकल) की है।

axis : int, default 0

स्तर : int, स्तर का नाम, या इस तरह के अनुक्रम, डिफ़ॉल्ट कोई नहीं

यदि अक्ष एक मल्टीएंडेक्स (पदानुक्रमित) है, तो एक विशेष स्तर या स्तरों द्वारा समूह

as_index : बूलियन, डिफ़ॉल्ट सही

एकत्रित आउटपुट के लिए, समूह लेबल के साथ ऑब्जेक्ट को इंडेक्स के रूप में लौटाएं। केवल DataFrame इनपुट के लिए प्रासंगिक है। as_index = गलत तरीके से "SQL-style" समूहीकृत आउटपुट है

सॉर्ट : बूलियन, डिफ़ॉल्ट सही

समूह कुंजियों को क्रमबद्ध करें। इसे बंद करके बेहतर प्रदर्शन प्राप्त करें। ध्यान दें कि यह प्रत्येक समूह के भीतर टिप्पणियों के क्रम को प्रभावित नहीं करता है। ग्रुपबी प्रत्येक समूह के भीतर पंक्तियों के क्रम को संरक्षित करता है।

group_keys : बूलियन, डिफ़ॉल्ट सही

कॉल करते समय, टुकड़ों की पहचान करने के लिए इंडेक्स कीज को इंडेक्स में जोड़ें

निचोड़ : बूलियन, डिफ़ॉल्ट गलत

यदि संभव हो तो वापसी प्रकार की गतिशीलता को कम करें, अन्यथा एक सुसंगत प्रकार लौटाएं

मनाया : बूलियन, डिफ़ॉल्ट गलत

यह केवल तभी लागू होता है जब समूह में से कोई भी श्रेणीबद्ध हो तो सही: केवल श्रेणीबद्ध समूह के लिए मनाया गया मान दिखाएं। यदि गलत है: श्रेणीबद्ध समूहों के लिए सभी मान दिखाएं।

संस्करण में नया 0.23.0।

यह दिखाता है:
GroupBy ऑब्जेक्ट

यह भी देखें

resample
आवृत्ति रूपांतरण और समय श्रृंखला के पुनर्निर्माण के लिए सुविधा विधि।

टिप्पणियाँ

अधिक के लिए उपयोगकर्ता गाइड देखें।

उदाहरण

डेटाफ़्रेम परिणाम

>>> data.groupby(func, axis=0).mean()
>>> data.groupby(['col1', 'col2'])['col3'].mean()

पदानुक्रमित सूचकांक के साथ DataFrame

>>> data.groupby(['col1', 'col2']).mean()