pandas 0.23 - DataFrame.pivot_table()

pandas.DataFrame.pivot_table




pandas

pandas.DataFrame.pivot_table

DataFrame.pivot_table(values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All') [source]

एक DataFrame के रूप में एक स्प्रेडशीट शैली की धुरी तालिका बनाएँ। धुरी तालिका के स्तर मल्टीफ़ंडेक्स ऑब्जेक्ट्स (पदानुक्रमित अनुक्रमित) में संग्रहीत किए जाएंगे, जो परिणाम के सूचकांक और स्तंभों पर होंगे।

पैरामीटर:
values : column to aggregate, optional

सूचकांक : कॉलम, ग्रॉपर, सरणी, या पिछली सूची

यदि कोई सरणी पास हो गई है, तो यह डेटा के समान लंबाई होनी चाहिए। सूची में किसी भी अन्य प्रकार (सूची को छोड़कर) हो सकते हैं। पिवट टेबल इंडेक्स पर समूह की कुंजी। यदि कोई सरणी पास हो गई है, तो इसे स्तंभ मानों के समान उपयोग किया जा रहा है।

कॉलम : कॉलम, ग्रॉपर, सरणी, या पिछली सूची

यदि कोई सरणी पास हो गई है, तो यह डेटा के समान लंबाई होनी चाहिए। सूची में किसी भी अन्य प्रकार (सूची को छोड़कर) हो सकते हैं। पिवट टेबल कॉलम पर समूह की कुंजी। यदि कोई सरणी पास हो गई है, तो इसे स्तंभ मानों के समान उपयोग किया जा रहा है।

aggfunc : फ़ंक्शन, कार्यों की सूची, तानाशाही, डिफ़ॉल्ट सुन्न

यदि फ़ंक्शन की सूची पास हो गई है, तो परिणामी पिवट तालिका में पदानुक्रमित कॉलम होंगे जिनके शीर्ष स्तर फ़ंक्शन नाम हैं (फ़ंक्शन ऑब्जेक्ट से खुद से जुड़ा हुआ है) यदि तानाशाही पास की जाती है, तो कुंजी को एकत्र करने के लिए कॉलम है और फ़ंक्शन या फ़ंक्शन की सूची है

fill_value : स्केलर, डिफ़ॉल्ट कोई नहीं

लापता मानों को बदलने के लिए मूल्य

मार्जिन : बूलियन, डिफ़ॉल्ट गलत

सभी पंक्ति / कॉलम जोड़ें (जैसे उप-योग / भव्य योग के लिए)

dropna : बूलियन, डिफॉल्ट ट्रू

उन कॉलमों को शामिल न करें जिनकी प्रविष्टियां सभी NaN हैं

मार्जिन_नाम : स्ट्रिंग, डिफ़ॉल्ट 'ऑल'

पंक्ति / स्तंभ का नाम जिसमें हाशिये के सत्य होने पर कुल योग होंगे।

यह दिखाता है:
table : DataFrame

यह भी देखें

DataFrame.pivot
एकत्रीकरण के बिना धुरी जो गैर-संख्यात्मक डेटा को संभाल सकती है

उदाहरण

>>> df = pd.DataFrame({"A": ["foo", "foo", "foo", "foo", "foo",
...                          "bar", "bar", "bar", "bar"],
...                    "B": ["one", "one", "one", "two", "two",
...                          "one", "one", "two", "two"],
...                    "C": ["small", "large", "large", "small",
...                          "small", "large", "small", "small",
...                          "large"],
...                    "D": [1, 2, 2, 3, 3, 4, 5, 6, 7]})
>>> df
     A    B      C  D
0  foo  one  small  1
1  foo  one  large  2
2  foo  one  large  2
3  foo  two  small  3
4  foo  two  small  3
5  bar  one  large  4
6  bar  one  small  5
7  bar  two  small  6
8  bar  two  large  7
>>> table = pivot_table(df, values='D', index=['A', 'B'],
...                     columns=['C'], aggfunc=np.sum)
>>> table
C        large  small
A   B
bar one    4.0    5.0
    two    7.0    6.0
foo one    4.0    1.0
    two    NaN    6.0
>>> table = pivot_table(df, values='D', index=['A', 'B'],
...                     columns=['C'], aggfunc=np.sum)
>>> table
C        large  small
A   B
bar one    4.0    5.0
    two    7.0    6.0
foo one    4.0    1.0
    two    NaN    6.0
>>> table = pivot_table(df, values=['D', 'E'], index=['A', 'C'],
...                     aggfunc={'D': np.mean,
...                              'E': [min, max, np.mean]})
>>> table
                  D   E
               mean max median min
A   C
bar large  5.500000  16   14.5  13
    small  5.500000  15   14.5  14
foo large  2.000000  10    9.5   9
    small  2.333333  12   11.0   8