pandas 0.23 - DataFrame.boxplot()

pandas.DataFrame.boxplot




pandas

pandas.DataFrame.boxplot

DataFrame.boxplot(column=None, by=None, ax=None, fontsize=None, rot=0, grid=True, figsize=None, layout=None, return_type=None, **kwds) [source]

DataFrame कॉलम से बॉक्स प्लॉट बनाएं।

डेटाफ़्रेम कॉलम से वैकल्पिक रूप से कुछ अन्य स्तंभों द्वारा समूहीकृत किए गए बॉक्स और व्हिस्कर प्लॉट बनाएं। एक बॉक्स प्लॉट उनके चतुर्थक के माध्यम से संख्यात्मक डेटा के समूहों को रेखांकन के लिए एक विधि है। बॉक्स डेटा (क्यू 2) की एक पंक्ति के साथ, डेटा के Q1 से Q3 चतुर्थक मानों तक फैली हुई है। डेटा की सीमा दिखाने के लिए मूंछों का विस्तार बॉक्स के किनारों से होता है। मूंछ की स्थिति बॉक्स के किनारों से डिफ़ॉल्ट रूप से 1.5 * IQR (IQR = Q3 - Q1) द्वारा निर्धारित की जाती है। बाहरी बिंदु वे मूंछों के अंत के अतीत हैं।

अधिक जानकारी के लिए देखें कि विकिपीडिया में boxplot लिए प्रविष्टि है।

पैरामीटर:

कॉलम : str या str की सूची, वैकल्पिक

कॉलम नाम या नामों की सूची, या वेक्टर। pandas.DataFrame.groupby() लिए कोई भी मान्य इनपुट हो सकता है।

द्वारा : str या array-like, वैकल्पिक

DataFrame में pandas.DataFrame.groupby() में कॉलम। by कॉलम के मूल्य के अनुसार एक बॉक्स-प्लॉट किया जाएगा।

कुल्हाड़ी : वर्ग की वस्तु matplotlib.axes.Axes, वैकल्पिक

बॉक्सप्लॉट द्वारा उपयोग किए जाने वाले मेटप्लोटलिब कुल्हाड़ियों।

फॉन्टाइज : फ्लोट या स्ट्रेट

बिंदुओं में या स्ट्रिंग के रूप में (जैसे, large ) टिक लेबल फ़ॉन्ट आकार।

सड़ांध : इंट या फ्लोट, डिफ़ॉल्ट 0

स्क्रीन के संबंध में लेबल के रोटेशन कोण (डिग्री में) sytem समन्वय।

ग्रिड : बूलियन, डिफ़ॉल्ट सही

इसे True पर सेट करना ग्रिड को दिखाएगा।

अंजीर : एक इंच (चौड़ाई, ऊँचाई) इंच में

Matplotlib में बनाने के लिए आकृति का आकार।

लेआउट : ट्यूपल (पंक्तियाँ, कॉलम), वैकल्पिक

उदाहरण के लिए, (3, 5) शीर्ष-बायीं ओर से शुरू होकर 3 कॉलम और 5 पंक्तियों का उपयोग करके सबप्लॉट प्रदर्शित करेगा।

return_type : {'axes', 'dict', 'दोनों'} या कोई नहीं, डिफ़ॉल्ट 'axes'

लौटने की तरह की वस्तु। डिफ़ॉल्ट axes

  • 'axes' रिटर्न देता है matplotlib कुल्हाड़ियों पर बॉक्सप्लॉट खींचा जाता है।
  • 'डिक्टेड' एक ऐसा शब्दकोश देता है, जिसके मूल्य बॉक्सप्लॉट की matplotlib लाइन्स हैं।
  • 'दोनों' कुल्हाड़ियों और हुकुम के साथ एक नामांकित व्यक्ति को लौटाता है
  • जब के साथ समूहीकरण, एक श्रृंखला मानचित्रण कॉलम को लौटने के लिए वापस return_type जाता है।

    अगर return_type None , तो layout रूप में एक ही आकार के साथ कुल्हाड़ियों की एक संख्या सरणी है।

** kwds

अन्य सभी प्लॉटिंग कीवर्ड तर्कों को matplotlib.pyplot.boxplot()

यह दिखाता है:

परिणाम :

वापसी प्रकार return_type पैरामीटर पर निर्भर करता है:

  • 'axes': क्लास matplotlib.axes.Axes का ऑब्जेक्ट
  • 'तानाशाह': matplotlib.lines की तानाशाही ।ine2D वस्तुओं
  • 'दोनों': स्ट्रैचर के साथ एक nametuple (कुल्हाड़ी, रेखाएं)

इसके साथ समूहीकृत डेटा के लिए:

  • Series
  • array ( return_type = None के return_type = None )

यह भी देखें

Series.plot.hist
हिस्टोग्राम करें।
matplotlib.pyplot.boxplot()
माटप्लोटलिब समतुल्य भूखंड।

टिप्पणियाँ

जब आप प्लॉटिंग के बाद लाइनों की उपस्थिति को मोड़ना चाहते हैं, तो return_type='dict' उपयोग करें। इस मामले में बक्से, टोपी, उड़ान भरने वाले, मंझला और मूंछ बनाने वाली रेखाओं से युक्त एक तानाशाही वापस आ जाती है।

उदाहरण

डेटाफ्रेम में प्रत्येक कॉलम के लिए df.boxplot() या उपयोग किए जाने वाले कॉलम को इंगित करने के लिए बॉक्सप्लेट बनाए जा सकते हैं:

>>> np.random.seed(1234)
>>> df = pd.DataFrame(np.random.randn(10,4),
...                   columns=['Col1', 'Col2', 'Col3', 'Col4'])
>>> boxplot = df.boxplot(column=['Col1', 'Col2', 'Col3'])
../_images/pandas-DataFrame-boxplot-1.png

तीसरे चर के मूल्यों द्वारा समूहीकृत चर वितरण के बॉक्सप्लेट by विकल्प का उपयोग करके बनाया जा सकता by । उदाहरण के लिए:

>>> df = pd.DataFrame(np.random.randn(10, 2),
...                   columns=['Col1', 'Col2'])
>>> df['X'] = pd.Series(['A', 'A', 'A', 'A', 'A',
...                      'B', 'B', 'B', 'B', 'B'])
>>> boxplot = df.boxplot(by='X')
../_images/pandas-DataFrame-boxplot-2.png

स्ट्रिंग्स की एक सूची (अर्थात ['X', 'Y'] x- अक्ष में चर के संयोजन द्वारा डेटा को समूहित करने के लिए बॉक्सप्लॉट में उत्तीर्ण की जा सकती है:

>>> df = pd.DataFrame(np.random.randn(10,3),
...                   columns=['Col1', 'Col2', 'Col3'])
>>> df['X'] = pd.Series(['A', 'A', 'A', 'A', 'A',
...                      'B', 'B', 'B', 'B', 'B'])
>>> df['Y'] = pd.Series(['A', 'B', 'A', 'B', 'A',
...                      'B', 'A', 'B', 'A', 'B'])
>>> boxplot = df.boxplot(column=['Col1', 'Col2'], by=['X', 'Y'])
../_images/pandas-DataFrame-boxplot-3.png

बॉक्सप्लेट के layout को layout लिए एक टपल देते हुए समायोजित किया जा सकता है:

>>> boxplot = df.boxplot(column=['Col1', 'Col2'], by='X',
...                      layout=(2, 1))
../_images/pandas-DataFrame-boxplot-4.png

अतिरिक्त स्वरूपण बॉक्सप्लॉट के लिए किया जा सकता है, जैसे ग्रिड ( grid=False ) को दबाकर, एक्स-अक्ष में लेबल को घुमाना (यानी rot=45 ) या फ़ॉनेट को बदलना (यानी fontsize=15 ):

>>> boxplot = df.boxplot(grid=False, rot=45, fontsize=15)
../_images/pandas-DataFrame-boxplot-5.png

boxplot द्वारा boxplot गए तत्व के प्रकार का चयन करने के लिए पैरामीटर return_type का उपयोग किया जा सकता है। जब return_type='axes' चुना जाता है, तो matplotlib axes जिस पर boxplot खींचा जाता है, वापस आ जाते हैं:

>>> boxplot = df.boxplot(column=['Col1','Col2'], return_type='axes')
>>> type(boxplot)
<class 'matplotlib.axes._subplots.AxesSubplot'>

जब के साथ समूहीकरण, एक श्रृंखला मैपिंग कॉलम return_type पर लौटा है:

>>> boxplot = df.boxplot(column=['Col1', 'Col2'], by='X',
...                      return_type='axes')
>>> type(boxplot)
<class 'pandas.core.series.Series'>

यदि return_type None , तो layout रूप में एक ही आकार के साथ कुल्हाड़ियों की एक संख्या सरणी है:

>>> boxplot =  df.boxplot(column=['Col1', 'Col2'], by='X',
...                       return_type=None)
>>> type(boxplot)
<class 'numpy.ndarray'>